0
作者丨郭 思
编辑丨陈彩娴
2023 年,一场大模型剧场大戏持续上演。
台前,以对话形式出现的ChatGPT成为当前人工智能变革浪潮的佼佼者,“懂语言者得天下”是现今大模型市场显著的商业现实。幕后, NLP、CV 的发展使得AI的价值被大众重新挖掘。多模态的发展也让文图处理的价值到达了新的高峰,而这其中,以OCR技术为基础的AI视觉技术也有较为亮眼的表现。
扫描产品无形之中迎来了第二春,此前频频登上 Github Trending 日榜月榜的开源项目 PaddleOC 、使用量众多的Adobe Acrobat DC 等这些其实都是运用AI视觉技术有效解决用户问题的优秀扫描产品。疫情期间,扫描产品也是为数不多实现逆势增长的AI落地赛道。
一时间,用户重新将目光聚焦于扫描产品。才猛然发现,AIGC杀手级应用或许已近在眼前,扫描产品带来的巨大想象空间让我们对于AI产品落地充满着期待。
计算机科学自1950年代起步,在扫描这一特定领域,其技术路径经历了从早期的统计模式识别,到句法模式识别、人工神经网络、支持向量机等不同阶段,最终发展至今天的深度学习技术。从使用范围和功能上而言,如今的扫描产品早已不再局限于大众眼中传统的车牌识别等,而是装进了人们触手可及的手机里,以智能而实用的APP产品出现。
疫情三年,扫描产品实现逆市增长,IDC数据显示,2021年我国全年文档扫描仪出货量达到46.1万台,同比疫情相对严重的2020年增幅达到了9.7%。在传统大金融以及政府、教育等主流行业的推动下, “后疫情” 时代的文档扫描仪市场迸发出蓬勃生机。国外市场情况也一片大好,Office lens、Google Lens等老牌扫描产品在2022年均有着不错的月活成绩。扫描产品无疑是 AI 落地的一支「潜力股」。
AI 科技评论根据公开资料整理
如此巨大增长的背后,其实是因为扫描这个看似普遍不起眼的行业恰恰切中了AIGC产品落地并得以加速推广的关键要点—C端市场的突破。
这其实也是ChatGPT火爆的逻辑。ChatGPT通过其高度逼真的AI对话能力和对用户需求的精准理解,成功打破了技术壁垒,使得复杂的AI技术能够在普通消费者中得到广泛接纳和应用。Similarweb的数据显示,ChatGPT在上线仅仅两个月的时间里,其月活跃用户数就已经达到了1亿人。相比之下,即使是现象级的短视频应用TikTok达到相同用户量级也花费了大约9个月的时间。
AI工具必须追求普惠是行业共识。以OCR技术为基础的AI视觉技术与 ChatGPT 有着相似变革范式,自然也就得到了大家的广泛关注。而另一方面,经过数十年的技术演变与发展,在攻克数据、格式等问题后,以OCR技术为基础的AI视觉技术落地与推广已“瓜熟蒂落”。
Grand View Research的报告指出,随着深度学习和人工智能技术的进步,AI视觉技术的准确性和效率得到了显著提升。例如,谷歌的Tesseract OCR引擎在多项测试中取得了接近100%的识别准确率,极大地解决了数据准确性的问题。面对格式这个老大难问题,如今的扫描产品已经能够处理各种复杂的文档格式和布局,包括表格、图像、图形以及多语言文本等,Adobe Acrobat Pro DC和ABBYY FineReader等主流扫描产品都提供了强大的格式识别和转换功能。IBM的一项研究也强调随着企业对自动化和智能化需求的增加,扫描技术在金融、医疗、法律、教育等多个行业中的应用越来越广泛。
来到AI大模型时代,扫描这一市场再次迎来了新的生机。今年8月,夸克扫描王率先在扫描行业落地大模型技术应用,开启了AIGC+扫描的创新时代。
数据显示,加载大模型后,目前夸克扫描王手写字符识别准确率与复杂公式识别准确率已双双达到 99%的行业最高水准。透过夸克扫描王的冰山一角,我们猛然发现,其实如今的扫描产品早已经从单纯的硬件设备转变为集成了先进人工智能技术的多功能生产力效率工具。
2、Z世代人群需要怎样的生产力工具?
扫描市场其实并不是一个蓝海。外有谷歌、微软等老牌巨头的长久布局,内有一大批不断涌现的企业纷纷想分一杯羹。在以往的应用落地中,扫描产品在B端的应用十分之多。然而,在如此激烈的B端市场竞争之下,问题其实早已出现,在某些特定领域或用户群体中,扫描产品的需求可能已经接近饱和。拿个最简单的例子便是,在十分常见的企业环境中,许多公司已经实施了文档管理和流程自动化系统,对于新的扫描产品的需求十分有限。
困境之下,厂商们其实都意识到这个市场其实迫切需要新的突破点来实现新的增长。
在C端发力,是他们想到的最快也是最优的思路。不过尽管在C端产品的发力入局者多,但由于绝大多数厂商习惯于此前赖以生存的B端环境,往往对用户画像的把握度不够,市面上的许多扫描产品在基本功能上仍然存在一定程度的同质化。
如今活跃在C端市场的大多都是90后、00后。电通中国《2022解码Z世代》指出如今近3亿Z世代人群2022年就撬动达5万亿元的消费支出,俨然成为国内市场新的消费增长极。Z世代的群像特征十分明显。他们热衷于寻求理想“人设”,对于自己使用的产品有着更高的个性化需求和品质要求。
他们不仅需要基本的扫描和AI 识别功能,还期望应用能集成其他实用工具,如文档编辑、格式转换、云存储、协作分享等。这批人也很跳脱,希望在各种场景之下都能使用上扫描产品。期待产品能够适应不同的环境和需求,如课堂笔记扫描、合同管理、发票报销等。更为重要的是,他们追求产品能够真正解决自己的问题。
拿最常见的文档处理场景而言,当我们拿到一份横版的发票,需要打印在A4中,进行报销,这个时候,我们如果不额外设置,就会变成一张小发票居于巨大的A4中上方一侧,文字内容缩小,阅读体验很差。
而实际上,在这个场景中,我们真正的需求是机器能自动识别文件内容横竖版式,横版文件适配到A4纸上,自动适配A4纸张大小,打印出来更适合阅读。
这个需求非常小,却很细节,对于众多用户来说,是一个忍忍就过去了的痛点。不过对于现在挑剔的Z世代而言,可能第一次遇到后,就直接弃用这个产品了。
那么市面上有没有人注意到这个细微而重要的痛点呢,还真有,就是那个被年轻一代经常使用的夸克。在年轻用户群体的视角中,搜索、阅读小说、观看电影、通过拍照识别万物、进行文档翻译、生成简历、自拍制作证件照等,夸克都可以做到。
图注:夸克扫描王可以自动识别文件内容横竖版式,横版文件自动适配A4纸张大小。
可以说夸克的天下就是靠这群Z时代撑起来的,天然就有对于年轻一代需求精准把握的基因。8月29日,阿里智能信息事业群宣布搭载AI大模型技术的“夸克扫描王App”正式上线,这意味着夸克从夸克APP中将扫描王单拎出来,推出APP。
国内权威第三方数据机构QuestMobile此前调研显示,夸克扫描王在00后、90后人群占比超过54%,稳居行业第一。
推出扫描王APP之后,夸克的第一个动作便是将这些看似不起眼却十分影响用户体验的痛点梳理了一遍。通过场景推动技术,提升年轻人效率。
启动扫描产品的第一步,就意味着我们需要处理文档。这简洁的表述实际上定义了扫描的过程。各品牌对这句话的理解和处理方式揭示了他们的差异。对于夸克来说,即使是“处理”这个词汇,也蕴含着独特的思考。大部分扫描产品侧重于扫描动作后的文档定型,而夸克则不同,它认为既然目标是获得符合需求的文档,为何不将“处理”环节融入扫描过程呢?
例如,当需要为扫描文件添加滤镜时,常常会遇到扫描完成后内容无法编辑修改的问题。
为此,夸克扫描王推出了万能扫描功能。用户在拍摄文档后可以直接进行编辑,图片内容可直接修改,智能识别文件类型并优化滤镜效果。扫描件上的文字内容、字体样式可自由编辑修改,同时智能识别表格等内容,支持转为Excel、删除、替换和提取图片。
这样做带来的好处很直接,30页的文档处理速度比其他产品快了2倍。打开手机应用市场,下载同类软件,这个功能只有夸克能够做到。
上文提到的两个场景是我们日常常见,却的确会存在困扰的地方。此外,夸克扫描王还具备以下功能:能够扫描已完成填写的纸质文档,并一键转化为Word格式,精准还原原始排版。它能自动识别手写笔迹,让用户选择删除或保留手写字体,并可将其智能转换为印刷体样式。用户还可以在线编辑Word文档中的文字内容。
在对于表格的处理上,夸克扫描王可以直接拍照纸质表格,一键生成Excel表格,手写数字也能精准识别,Excel表格上直接选择行列在线求和计数。让财务党和会计党直呼YYDS。
扫描是一个有门槛、十分垂直的赛道,其发展与AI技术的不断迭代息息相关。
但在大部分其他AI产品都能达到95分的技术水平之际,扫描产品的杀出重围并不仅仅是在于从95到96的死磕前进,更多的是在于将目光投至切实的生产力场景。
AI时代,每个技术的发展周期和特性都各不相同,必须兼顾技术和市场的两端动态。
一方面,需要明确了解技术的局限性和边界在哪里,以便精准定位研发方向。另一方面,在推动技术商业化或产品化的过程中,也必须把握好节奏和优先级,确定何时以及如何将这些技术有效地转化为实际产品或服务。
这就要求厂商在探索技术创新的同时,也要对市场趋势和用户需求有深入的理解和敏锐的洞察。真正把提高生产力效率作为第一要义。
过去的三年疫情,扫描行业能够在寒冬中逆袭,也是源于其对生产力切实的效率提升。
如今来到大模型时代,夸克扫描王,在这场角逐之中,恰恰选了一条最精准也是最合适的道路,以用户为先,用场景倒推技术。改进行业难以解决的20%难题,收获80%的效果。才得以让这次AIGC杀手级应用之战开始有了新的风向。
随着大模型竞争步入下半场,AIGC应用的潜在爆发点还有哪些尚待探索?本文作者持续追踪大模型领域的最新进展,欢迎读者通过添加作者微信lionceau2046 进行深度交流与探讨。
雷峰网 雷峰网 雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。