OpenAI收购远程协作公司Multi，并终止对中国提供API服务，智谱提供「搬家计划」；剂泰医药完成1亿美元融资丨AI情报局

本文作者：我在思考中

2024-06-25 16:15

导语：产品推荐：Sherloq，LlamaIndex，Dot AI，Playmaker Document AI

融资快报

剂泰医药完成1亿美元C轮融资：剂泰医药是专注“AI+药物递送”的创新型生物技术公司，本轮融资由中金资本旗下基金领投，中国太平旗下太平香港保险科创基金跟投。此前已获得的红杉中国、国寿股权、人保股权、五源资本、峰瑞资本、源码资本、光速光合、砺思资本等顶尖投资机构投资。

久痕科技获得数千万元种子轮投资：久痕科技是一家关注知识工作的人工智能开发商，公司的第一款产品是以个人数据为中心的通用办公助理。

Iambic Therapeutics获5000万美元B+轮融资：Iambic Therapeutics（前身为 Entos）是一家人工智能医疗平台开发商。由新投资者 Mubadala Capital 和 Exor Ventures 领投，卡塔尔投资局以及老股东Abingworth、Illumina Ventures、Nexus Venture Partners、Coatue 和 Tao Capital Partners 参投。

两名05后高中生联手打造 API 初创，已获 50 万美元融资：两位年仅 18 岁的美国高中毕业生Christopher Fitzgerald 和 Nicholas Van Landschoot，共同创立了 APIGen。目前筹集了 50 万美元投资，投资公司是丹佛的 Varana Capital。该平台将通过自然语言提示建立定制化的 API，并将在本月发布一个测试版。

（欢迎添加微信AIyanxishe2，了解更多AIGC、融资情况，与志同道合的朋友一同畅聊时新AI产品）

国内情报：

OpenAI终止对中国提供API服务，智谱AI等国产大模型第一时间提供“搬家计划”：

OpenAI官网信息显示，自7月9日起，OpenAI将终止对中国大陆提供API（应用程序编程接口）服务。国产大模型快速发布应对方案，智谱bigmodel.cn 推出 OpenAI API 用户特别搬家计划，轻松切换至国产大模型。智谱GLM 大模型全面对标 OpenAI 产品体系，全链路技术自研、安全可控。

为开发者提供：1.5亿 Token（5000万 GLM-4 + 1亿 GLM-4-Air）；从 OpenAI 到 GLM 的系列迁移培训。

为高用量客户提供：与 OpenAI 使用规模对等的 Token 赠送计划(不设上限)；与 OpenAI 对等的并发规模；匹配高等级会员政策；专属搬家顾问及5人天技术专家支持；备案培训和辅助。

字节跳动回应与博通合作开发5nm AI芯片：

有消息称字节跳动为削减采购成本并确保高端 AI芯片供应稳定，正与美国博通合作开发先进 AI 处理器。字节跳动回应称该消息不实。

科大讯飞获 2023 年度国家科学技术进步奖一等奖；与华为音乐达成全面深度合作：

科大讯飞作为第一完成单位的《多语种智能语音关键技术及产业化项目，获得国家科学技术进步奖一等奖。这是 2012 年深度学习引发新一代人工智能浪潮以来，人工智能领域首个国家科学技术进步奖一等奖。

此外，华为音乐与科大讯飞将基于 HarmonyOS 发展面向全场景时代的新生态，在已有的音乐内容发行、艺人合作、手机铃音 AI 创作等方面展开更加深入的合作。

阿里云通义灵码 AI 编程助手上线微软 Visual Studio 插件市场：

通义灵码个人专业版为限免阶段，所有用户均可享受个人专业版服务，限免期结束后，对所有开发者免费提供个人基础版服务，限免周期暂未确定。

阿里和华东师大推出AI合成视频后调优技术ExVideo、视频转卡通风格的框架Diffutoon：

ExVideo能够扩展现有视频合成模型的时间尺度，以生成更长和帧数更多的视频。该团队基于Stable Video Diffusion模型，训练了一个能够生成长达128帧连贯视频的扩展模型，同时保留了原始模型的生成能力。

Diffutoon基于扩散模型的可编辑卡通着色技术，能够将真实感视频转换成动漫风格。Diffutoon能够渲染细节丰富、高分辨率、长时间视频，并可通过附加分支根据提示编辑内容。

零一万物登陆阿里云百炼平台：

零一万物首次通过云厂商提供API服务，结合阿里云完备的工具链和丰富的云上算力资源，满足企业级需求。模型包含旗舰模型Yi-Large、高性价比模型Yi-Large-Turbo、支持实时搜索的Yi-Large-RAG以及适合日常通用场景的中等尺寸模型Yi-Medium。均提供限时免费调用额度。

图像动画技术的新突破MOFA-Video：

由杉杉茂茂大学和腾讯人工智能实验室研究人员提出的 MOFA-Video，通过在冻结的视频扩散模型中使用适应的运动，实现了基于轨迹和关键点的图像动画。该技术支持混合控制、运动画笔和光流控制等零样本功能，并进行了 MOFA-Adapter 架构的消融研究和领域特定调优。

南大与旷视研究院联手破解视觉大模型对齐难题：

他们推出的无监督范式SeVa，成功解决了视觉语言模型的偏好对齐问题，而且整个过程无需人类或GPT-4标注，大大降低了对齐成本，仅使用8k构造的无监督数据，就显著提升了VLM的指令遵循能力，降低了幻觉。这项技术的核心在于自动化构造偏好数据的pipeline，通过对比偏好对齐前后的模型输出，可以明显看出变化。

国际情报：

Nature研究称语言≠思维，大模型学不了推理：

《Language is primarily a tool for communication rather than thought》表明人类大脑的语言网络与形式化推理分离，语言主要是交流工具，而不是思考的媒介。研究通过 fMRI 等成像技术观察了大脑中语言区域的活动，发现语言网络支持语言理解和生成，对词义和句法结构有敏感性，但并非是思维的基础。即使在语言能力受损的情况下，人们仍能进行多种形式的推理，包括数学问题解决、执行规划和遵循非言语指令等。完整的语言系统并不意味着完整的推理能力，反之亦然。

研究发现 GPT-4o 的道德推理能力已比专家更强：

研究中 501 名美国成年人对 GPT-3.5-turbo 模型提供的道德解释表现出更高的认可度。另一项研究中，GPT-4o 生成的建议在 50 个 “伦理困境” 的评分中，几乎在所有方面都优于了著名伦理学家 Kwame Anthony Appiah 的建议。尽管 AI 在道德推理方面表现出色，但研究人员提醒谨慎对待其建议，并指出未来需要进一步研究以探讨不同文化背景下人们对 AI 生成的道德推理的接受度。

牛津研究人员利用语义熵来识破 AI“幻觉”：

该研究已发表在《自然》杂志，研究员提出了利用语义熵来检测大型语言模型的 “捏造” 问题的方法。该方法不需要额外的监督或强化学习，可以快速识别 LLMs 的 “幻觉” 问题，即使是在面对未知任务时也能应用，从而提高用户对 LLMs 的信任。这种方法能帮助用户判断何时需要对 LLMs 的输出保持谨慎，并为 LLMs 的应用开辟新的可能性。

将 AI 用于车辆初步检查，一分钟内可生成全面报告：

已有 300 家经销商采用 AI 系统进行车辆初步检查，该系统可拍摄车辆照片并检测外部、轮胎和可见机械部件的缺陷，快速生成报告，帮助技术人员及时发现并解决潜在问题，确保汽车安全。尽管 AI 系统可能会揭示未知缺陷导致额外成本，但提前发现问题比后续处理更为有利。

F1将与亚马逊联合推出AI“Statbot”数据机器人，提供个性化观赛体验：

“Statbot”在巴塞罗那站比赛期间利用亚马逊 AWS 云计算部门的技术，搜索比赛档案并解析大量实时赛车数据，向现场直播主持人提供背景信息与趣闻。

英伟达将在中东五国数据中心部署 AI 技术：

英伟达首次在中东地区大规模推出产品，Ooredoo 将成为该地区首家能够为其数据中心客户提供直接访问英伟达 AI 和图形处理技术权限的公司。此前，华盛顿曾限制向该地区出口美制尖端芯片。 5 个中东国家包括卡塔尔、阿尔及利亚、突尼斯、阿曼、科威特。

美国零售巨头将在2000家门店引入生成式AI聊天机器人：

Target Corporation将在全美近2000家门店推出一款名为 “Store Companion” 的生成式人工智能工具。这一 AI 聊天机器人旨在提高运营效率，提升购物体验，并成为 Target 超过40万员工的多面助手。除了改善员工工作效率，Target 还计划利用生成式人工智能改进产品描述和客户评论总结，为顾客提供更加精准、简洁的购物信息。

全球前20%的AI人才中国独占47%！韩国仅2%：

根据芝加哥大学保尔森研究所最新数据，中国在 AI 研究领域的顶尖人才数量已经几乎赶超美国。在2022年全球排名前 20%的 AI 研究人员中，中国占了 47%，而韩国仅占 2%。在排名前 2%的 AI 研究人员中，美国占 28%，中国占 26%，相较于 2019 年的 10%有了显著提升。

更多国际情报：

《Python 机器学习》作者新作，从头开始构建大型语言模型，代码已开源：《Build a Large Language Model (From Scratch)》旨在讲解从头开始构建大型语言模型的整个过程，包括如何创建、训练和调整大型语言模型。最近，Sebastian Raschka 在 GitHub 上开源了这本新书对应的代码库。

多家 AI 公司被曝绕过网络标准抓取新闻出版商网站内容：专注于“内容许可”领域的初创公司 TollBit 警告称，多家 AI 公司规避网络标准抓取内容并用于训练生成式 AI 系统。一些出版商已起诉 AI 公司，而其他则签署了许可协议。许多 AI 开发者认为他们的行为并未违法。

大众汽车海外新车搭载ChatGPT，智能交互功能全面升级：包括语音助手控制信息娱乐、导航和空调系统，以及提供旅游景点信息、足球比赛报道等服务。该功能目前仅限于海外车型使用。

Product Hunt 热榜，面向 SQL 用户的AI协作资源库Sherloq

Sherloq 是一个为 SQL 用户设计的协作性人工智能资源库。它是一个 Chrome 扩展程序，属于生产力和开发者工具类别，旨在帮助用户更高效地编写和优化 SQL 查询。Sherloq 通过提供智能化的代码助手和资源，使得数据库查询和管理变得更加简便。

?https://www.sherloqdata.io/?ref=producthunt

GitHub Trending 热榜，Build your own X

Build your own X旨在从零开始重构最喜欢的技术，帮助开发者更深入地理解并掌握编程。该项目由 Codecrafters, Inc. 管理，目前拥有超过 277k 个星标和 26.1k forks。提供了多种技术的构建指南，包括机器人、神经网络、操作系统、物理引擎、编程语言、视觉识别系统等。这些指南覆盖了多种编程语言，包括 C、C#、C++、Go、JavaScript、Python、Ruby、Rust 等。

?https://github.com/codecrafters-io/build-your-own-x

开发者推荐

1.LlamaIndex 推出全新属性图索引功能

LlamaIndex 团队发布了新的属性图索引Property Graph Index，为知识图谱构建提供了更灵活和强大的方法。该功能使用属性图表示法，克服了传统知识三元组的局限，支持节点和关系的标签和属性分配，并能同时执行向量和符号检索。开发者可以通过多种图构建方法（如基于模式的提取、隐式提取和自由形式提取）灵活控制知识图谱结构。

此外，属性图索引支持关键词/同义词检索、向量相似性检索、Cypher 查询语言和自定义图遍历，实现高级混合搜索。LlamaIndex 还提供 PropertyGraphStore 用于直接操作图数据，包括插入、更新和查询节点、关系及属性。

?https://www.llamaindex.ai/blog/introducing-the-property-graph-index-a-powerful-new-way-to-build-knowledge-graphs-with-llms?utm_source=uwl.me

2.Dot AI 伴侣应用程序

Dot 是由 New Computer 公司开发的一款 AI 伴侣应用程序。该应用程序由 Jason Yuan（前苹果设计师）和 Sam Whitmore（工程师）共同创立，并获得了来自 Lachy Groom、OpenAI Fund 和 South Park Commons 等的 370 万美元融资。

Dot 是一款专为 iPhone 用户设计的个性化 AI 应用程序，它能够随着用户的互动而学习和演进，拥有无限的长期记忆，能够提供个性化的建议和指导，帮助用户成为更好的自己。

?https://apps.apple.com/us/app/dot-living-history/id6450016041

3.Otto：为 AI 工作设计的工具

Otto 是一个专为 AI 工作设计的工具，通过定义一次表格来自动化成千上万的任务，提升研究和分析公司、市场和行业的效率。用户只需点击 “获取访问权限” 即可开始使用 Otto，其多种模板（如公司研究、竞争对手格局分析和外向邮件创建器）展示了 Otto 的强大功能。Otto 利用智能推理引擎，几分钟内完成通常需要几小时的工作，提供表格驱动的界面，支持可定制列、高级过滤和精确定制输出，并行运行数百个任务，让用户专注于更大的画面。

?https://ottogrid.ai/

4.Playmaker Document AI：简化文档工作流程

Playmaker Document AI 是一款自动化工具，专为简化文档工作流程设计。它支持多种文档类型，如合同、发票和身份证明等，能够通过电子邮件、API 或手动上传方式提交文档，从而自动提取、验证和处理数据。提取的数据可推送到 300 多个集成系统，实现高效的自动化流程。

此外，Playmaker Document AI 确保数据安全性，处理完成的文档会在 7 天内安全删除。系统具有持续学习能力，不断提高处理精度，并提供全球团队支持，让用户轻松提高工作效率。

?https://www.playmaker.so/document-ai

5.Diffutoon：将光照 tracing 视频转换为动漫风格

Diffutoon 项目旨在将现有的光照 tracing 视频转换为具有动漫风格的影片，适应极高的分辨率和快速动态场景。项目源代码已在 DiffSynth-Studio 平台上开源，并附有技术报告。

?https://ecnu-cilab.github.io/DiffutoonProjectPage/

6.groqnotes：智能音频转录与笔记生成工具

groqnotes 是一个基于 Streamlit 的应用程序，利用 Groq 云端的 Whisper-large 和 Llama3 模型，将音频转录为结构化笔记。支持 Markdown 格式和 PDF 下载。功能亮点包括：

音频转录：上传音频文件，快速转录成包含表格、代码和 Markdown 格式的笔记。

示例展示：提供如何使用工具生成 YouTube 视频内容笔记的示例。

下载选项：生成的笔记可下载为文本或 PDF 文件，方便保存和分享。

?https://github.com/Bklieger/groqnotes

7.Nucleus 宣布 Anifusion 新功能：

Nucleus 在 X 平台上宣布，即将在 ANIFUSION DOT AI 上推出漫画画板创建功能，简化用户操作。新功能包括自动图像定位和即将添加的文本工具，用户无需手动剪辑图像即可轻松创建漫画画板。

?https://anifusion.ai/

大牛洞见

AI Storyteller 课程：掌握人工智能和大型语言模型的知识

Andrej Karpathy 推出了一个名为 LLM 101 的新课程，专注于大型语言模型的基础知识和实践应用。通过构建一个 AI Storyteller，学习者将全面理解并掌握人工智能和大型语言模型的知识。课程从基础到高级，涵盖编程语言、数据类型、张量操作、深度学习框架和神经网络架构。多模态学习部分更是深入探讨如何处理和生成图像、音频和视频数据，提供从初学者到高级用户的全面学习路径。

? https://github.com/karpathy/LLM101n

敬请期待明日的最新动态！

AI情报局征集情报合伙人，汇集独家价值线索！如果您可以提供有关AI最新成果&行业内幕&独特产品，请添加运营微信号：AIyanxishe2备注行业岗位。

雷峰网(公众号：雷峰网)

雷峰网版权文章，未经授权禁止转载。详情见转载须知。

0人收藏

我在思考中

运营

发私信

当月热门文章