0
2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路;同年8月23日,正式推出国内第一款融入大语言模型的搜索引擎——天工AI搜索。过去一年多的时间,我们全身心投入打磨产品,持续提升模型能力。
今天,昆仑万维天工AI正式发布最新版本的AI高级搜索功能。
一年时光,栉风沐雨。我们致力于通过领先的AI技术,为全球用户提供创新的智能搜索和信息处理解决方案。无论是金融、科技领域的专业搜索还是文档分析,「天工AI高级搜索」将为用户提供前所未有的搜索体验,赋能各领域的数字化转型和智能化升级。
不限使用次数!复杂问题的智能、专业搜索,从这里开始探索:https://www.tiangong.cn/
本次天工AI高级搜索功能,具备四大亮点:
• 全面升级多层次分析推理能力
• 升级的金融投资专业AI搜索
• 升级的科研学术专业AI搜索
• 针对文档AI阅读分析的智能优化
「天工AI高级搜索」不仅能提供精准的结果,更能通过多角度的专业优化,将用户需求转化为真正可执行的智能解答。在数据和信源的时效性、权威性、质量、相关性,以及内容索引丰富度等方向进行全方位升级,针对用户在复杂问题解决、金融投资、科研学术、文档分析等多领域的需求,带来专业优化和流畅体验。
难题拆解+自动规划+主动扩展+深度回答+图文交织,五位一体。 本次升级的天工AI高级搜索采用了强推理能力,具备卓越的多层次分析推理能力。
智能搜索Agent把复杂的难题拆解为多个简单的问题,自动规划路径,一边思考一边执行。
自研大模型搜索Agent,面对用户输入的问题,能够模拟人的思考和推理过程,自动生成任务规划并逐步完成预设任务路径,并在每一步检查任务的执行情况,确保最终结果的准确性。凭借大模型的深度理解与自我验证机制,它能够在无需用户干预的情况下,为复杂问题提供高效且精准的解答。
例如我们让大模型分析“过去三年诺贝尔奖得主及贡献”,天工AI高级搜索拿到问题之后,不会笼统的给答案,而是理解、拆解、推理、引导。
我们可以看到,AI先自己查询了过去三年诺贝尔奖得主,然后再查询每位获奖者的详细贡献,并且给出了足够丰富、权威、可追溯的信源,在右侧参考链接栏,可以直接点击追溯原论文或信息源。
接着通过大模型对结果进行精准的理解和总结,天工AI能够为用户提供更加全面、深入且权威的高质量回答。在强推理能力的加持下,显著提高了用户在处理复杂问题时的信息获取效率,同时提升了结果的深度与可靠性。
在经过问题拆解后,天工AI按照物理学奖、化学奖、生理学或医学奖,开始逐年分析,以图文并茂的方式回答了他们的名字、贡献,并附上了他们的入选代表作,用户可以直接跳转查看原论文PDF。
此外,主动扩展能力也得到升级。
通常情况下,用户只是在粗略地表达自己的需求,不会把问题描述得很全很精确。之前的AI大模型在逐步提示问题方面做得不够细致,因此不能给出更全面的回答。
但是在天工AI中,我们尽管只输入一句搜索关键词“详细解读天工大模型”,天工AI则会自动扩展它的定义、背景、技术架构、案例等,一次性为用户展示出来,并在每个问题拆解中都涵盖arXiv等权威信源。
无论用户面临的是跨领域的复杂难题,还是需要逐步解决的多步骤任务,天工AI都能通过逐层推理,准确识别问题的核心并提供深度洞察。系统能够理解复杂的上下文关系,并通过逻辑推理为用户提供高质量的解决方案,做更懂你、更省心、更精准的AI搜索。
推理能力的跨越式提升,离不开数据和信源检索技术的升级。
在数据上,我们投入了巨大精力追求极致:高质量、权威、实时、专业的金融数据收录,中英文最全学术数据接入。
我们引入了海量(超过10亿)的专业型数据,包括网页、PDF(比如研报、财报、海内外权威学术文档),并对这些原始数据花费了巨量精力进行解析,能够识别出其中的文本、图表、图片等多模态内容,同时将这些图表、图片信息做了相应的检索库。
此外,天工AI还构建并搭载了分钟级的信源收录系统,能够更快地收集全网高价值信息;构建了自研搜索引擎、以多模态交互结果输出,能够针对部分垂类做更深入的信源排序优化,让用户看到更多的内容细节。
为了让用户体验更高级的搜索结果,我们对AI搜索信源检索系统也进行了全面的技术升级。使其具备分钟级实时内容检索能力、高权威信息提供能力、高精准信息索引和召回能力、更好的搜索结果排序体验。
天工AI在金融方向的高级搜索功能包含金融政策查询、指标查询、财务数据对比、财报分析、公司分析、研报解读、投资理财等。无论是专业金融数据获取,还是实时数据、多条件复合查询,亦或答案中引用财报研报的AI解读,你都可以在天工AI高级搜索功能中找到图文并茂的答案。
天工AI能够从几十页繁杂的财报报表中提取关键数据、整理成关键指标表格,还支持一键复制,甚至可以对比每条数据间的关系,并进一步分析原因。
例如我们希望快速读取茅台股份2024年第一季度财报中的关键信息,天工AI可以快速用表格的形式为你分析营业收入,并提炼出业务情况、现金流、关键数据出现波动的原因等核心要点。
针对上市公司股票,天工AI可以给出投资者比较关心的公司基本面分析(含公司介绍、财务历年分析)、技术面分析(股价走势分析及指标解读)、消息面及资金面分析,内容丰富,让投资者对投资标的及实时股价有更全面的了解。
使用天工AI搜索“拼多多股票”,不仅可以看到官方发布的企业公告、最新财报,还能看到东方财富、雪球等财经平台提供的资讯和分析内容。基于全方位升级的金融数据库,天工AI能为用户分析标的公司的业务发展、财报数据、资金面和技术面等,并给出对应的投资建议。
天工AI可以做到实时查询财务数据,以及多条件复合查询,以深度内容、权威数据和精确分析为支撑,为用户提供高效且深入的金融信息服务,满足专业投资者和金融从业者的需求。
当你想知道“目前股息率超过5%且2023年经营现金流为正的公司”有哪些?天工 AI 可以用表格的形式帮你找出这些公司、横纵向对比分析它们的财务表现,并且能够逐一分析它们的业绩数据和实时股价。
之所以能够达到上述实时数据获取、深度分析的能力,离不开我们在以下四个关键方面持续的深入开发和优化:
1. 权威金融数据库接入:接入多家全球权威金融数据库,同步挖掘中国境内5000多上市公司和美国上市全部中概股的官网、专业财经网站、股票论坛,第一时间收录公司资讯、财报、研报等专业数据,关注各大券商资深分析师的报告,将天工打造成最优秀的金融财经助手。同时还引入了企业的收费数据,比如股票的实时信息,让信息更及时,更准确。
2. 全网研报质量分级:搜集并整理了全网的优质金融研报,并构建了分级算法,对报告质量进行细致划分。凭借自然语言处理和内容质量评估模型,能够筛选出高质量的信息资源,为用户提供有价值的研报内容。
3. 金融问题分析方法库:内置了涵盖各类金融问题的分析方法库,包括财务分析和风险评估等,通过深度学习模型和专家知识体系,可以自动适配问题情境,灵活调用适合的分析方法,为用户带来深入而准确的解析。
4. 智能选择信息来源&优质内容识别:具备智能信息决策机制,能够根据用户的查询需求,在解决问题过程中精准选择合适的内容和数据来源(网页、文档或数据库),并对内容质量进行判别。通过内容分析算法,自动过滤泛泛信息,确保提供内容具有深度和专业性,使用户在复杂金融问题中获得真正有价值的解答。
同样,为了让用户在天工阅读和搜索最新最全的学术论文,我们建立了国内科研学术AI搜索方向最全的学术元数据库。
为保障学术信源搜索确保高准确性,精选来自arXiv等权威论文网站的数据重点发力英文论文的爬取,收录英文论文量两亿多篇,全学科的学术论文PDF版本基本全覆盖。基于天工全自研的网页调度系统,监控全球学术网站,分钟级发现并抓取最新论文的PDF版本,为了加强论文的全方位解读和分析,也收录了X、substack等活跃学术讨论观点。
搜索“大模型对齐技术”,映入眼帘的是十多篇来自arXiv的论文,天工AI不仅帮用户直接分析了这些论文,还将PDF原文一一对应到相应的论点中去,用户能直接溯源点击查看原论文。
不仅在信源的质和量上有升级,天工AI对科研学术领域的问题拆解和分析,也做到了有广度、有深度。
让天工AI“评价Transformer模型的未来发展趋势”,它不仅分析了几十篇中英文论文,还将图片和技术术语进行详解,从技术细节、最新进展、应用现状分析了专业AI领域的问题。
天工AI要做最懂科研的搜索助手,用户只需输入查询意图,就能“端到端”快速定位到相关高质量论文。不仅能够直接呈现精确匹配的文献,还能自动生成关键信息的总结与引用,支持用户快速获取论文核心内容。
我们只需要向天工AI提问“最新LLM论文”,它就可以开始依次检索2024年、2023年的最新相关论文,并将每篇论文的发布时间、来源、核心内容等提炼出来。
定位论文之后,还有以下升级亮点值得探索:
• 按照研究背景、研究方法、实验分析、结果分析、总体结论拆解论文,详略得当的总结论文关键信息
• 解读论文中晦涩难懂的公式,并辅以文字解释;支持LaTex语法导出,一键提取复杂公式
• 更强的表格理解能力,图文并茂的重点解读分析研究方法、实验结果等论文核心内容
正如上图所示,搜索“大模型对齐技术”,天工AI除了对文字上的准确解读,更能够精准理解论文中的多模态内容,可以做到直接将论文中的数学公式提取出来,让科研用户使用起来更高效。
天工AI高级搜索在文档AI阅读分析领域取得了突破性进展,不仅能够在文字理解上精准归纳和分析复杂的财报、研报、论文等各类文档,还具备超强的上下文理解能力,支持处理超过500K字的超长文本。
天工搭建专业团队花了一年多的时间自研了PDF文档解析引擎、开发文档解析大模型,在标题、作者、摘要、引用、图片、表格、公式、子标题等全部指标上达到SOTA,特别是在多列文档、分页换行上精调了识别大模型,超越当前所有模型,在底层技术上的大力投入表明了我们在AI赛道上的决心。
首先,在高级模式下,增加了新的交互和功能:PDF引用信源、PDF浮窗、引用原文展示、深度解析、专业信源展示。
例如PDF浮窗功能:将鼠标放置在PDF引用信源处,即可展示学术论文的基础信息,包括学术论文的标题、作者、期刊、引用次数、发布时间等信息,可以直观看到AI解答的内容具体来自于哪一篇学术论文或财报。
其次,「天工AI阅读」新增了针对学术论文、公司财报、券商研报等场景的深度解析模式,点击文档深度解析后可直达文档AI解读和AI对话功能,可以对完整的文档进行精读,并且产生图文并茂的AI解读。
如上图所示,「天工AI阅读」通过研究背景、研究方法、实验设计、结果分析等对论文的核心内容进行解读。我们还支持对文章的问答,用户针对该篇论文有任何问题都可以通过问答区域进行问答,由大模型进行回答。
同时,还可以提供论文点评、论文十问、脑图功能(如下图所示),来帮助阅读者更好的解析论文。
更重要的是,天工AI在文字解读的基础上,将原始材料中的关键信息(如数据、表格、公式、图、图片等)以多模态方式输出,帮助用户全方位地理解和解读文档中的重要内容和数据。
我们让天工AI阅读企业财报时,它可以快速提取公司的股权结构、业务情况、战略布局、历年财务数据、企业优势等精华内容,以简洁的图表形式向用户呈现。
这一功能让用户得以体验远超传统大模型文档理解的精准性与深度分析,显著提高信息获取的效率与准确性,特别是在处理大量复杂资料时,天工AI提供了前所未有的高效文档分析解决方案。
如何使用?
两种方法:1)点击搜索结果中PDF悬浮窗的深度解析入口,2)在AI文档-音视频分析Agent中直接上传PDF。
与其他长文本搜索分析不同,「天工AI阅读」重磅升级多模态长序列摘要能力,更准、鲁棒性更高的PDF解析能力,支持长序列理解摘要、基于RAG的超长本文问答、跨文档的摘要问答、文档分析脑图生成。
其中,超长文档问答功能支持多个跨页复杂表格,联合文本分析和表格数据提取、推理,准确回答用户问题。
例如,用户上传一份132页的超长财务报告,要求「天工AI阅读」分析:“应交税费的期末余额中,增值税和企业所得税分别占总税费比例是多少?” 天工AI能够快速找到对应原文位置后,提取第80页表格内的数据,经过推理和计算后最终回答给出指标。
跨文档的摘要问答功能支持跨文档总结、问答,用户可同时上传多个文档,支持对比不同文档共同点和差异,联合多个文档的内容回答用户问题。例如用户希望分析两家公司的财务数据(营收数据、盈利情况等),那么可以上传两家公司的财报,「天工AI阅读」可以利用多篇文档中的内容进行问答。
我们希望无论是行业专家还是普通用户,天工AI都能让你享受智能搜索带来的高效和便捷。
但我们不止步于此,模型和产品的升级仍在路上,天工AI致力于创新搜索体验:一步到位的智能解答。
自2020年开始,昆仑万维持续加大在 AI 大模型及各垂类行业应用的研发力度,成功地以 AI 技术驱动多元化应用创新。目前,昆仑万维已经构建了AI大模型、AI音乐、AI搜索、AI游戏、AI 社交、AI短剧等多元AI业务矩阵。
作为中国领先的人工智能科技公司,昆仑万维现已完成“算力基础设施—大模型算法—AI应用”全产业链布局,基座大模型侧,公司坚持技术创新,对文本大模型、多模态图文大模型、音乐大模型、3D大模型、视频大模型进行了全面升级,在性能上均达到行业领先水平,为用户带来前所未有的智能体验。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。