0
本文作者: nebula | 2024-04-17 17:44 |
AI时代,会议室的良好拾音和区分说话人技术,是实现语音转文字、字幕翻译和智能纪要等能力的前提。
4月17日,腾讯会议天籁实验室发布腾讯天籁inside3.0升级,在腾讯AI Lab多项技术加持下,推出16mic多模态人像分割解决方案,具备智能音幕功能,能够精准区分和定位会议室里的发言人,并升级了去混响效果。
同时,在本届InfoComm展会现场,MAXHUB、罗技、耳目达、poly、维海德、亿联网络等多家硬件厂商均推出了与腾讯会议合作的新一代场景方案和产品能力。通过领先的音视频与AI技术,腾讯会议正在持续助力厂商提升会议硬件的表现,提供听觉、视觉、内容上更加沉浸专注的会议体验。
发布腾讯天籁inside3.0,升级多项新能力
对线上参会人来说,线下会议室里多人并坐、仅有一个小窗口画面,想要准确分辨出是谁在说话,难度很大。
腾讯天籁inside3.0方案,涵盖AI+16阵列麦拾音矩阵+音视频多模态识别算法。具备智能音幕功能,能够精准区分和定位会议室里的发言人,并升级了去混响效果。
智能音幕能力,相当于在会议室里建立起虚拟音频屏障,让线上发言人只听到特定区域的声音,减少区域外的人声和噪声干扰。据介绍,智能音幕支持实时调整方向。
通过音视频多模态AI算法,腾讯天籁inside3.0还支持精准区分、定位发言人。基于这项能力并结合腾讯会议Rooms的多流技术打造的硬件,可以为每位发言人提供单独的视频画面,更接近在同一个会议室开会的体验,提升沟通的临场感。
天籁inside3.0还提升了去混响表现,并基于天籁16麦音频方案优化了降噪模型。实测显示,在多种会议室噪声的干扰下,无论发言人距离屏幕远近,线上都能清晰听到声音。
腾讯会议与MAXHUB联合发布了集成腾讯天籁inside3.0方案的两款产品。据介绍,腾讯天籁inside开放了底层坐标给合作厂商,厂商可自行定制发言人的画幅比例、多人对话时的切换速度、切换逻辑等,进行二次开发。
目前,天籁inside音频解决方案已覆盖一体机大屏、扩展麦、天花麦等产品,应用在MAXHUB、Newline、海信商显、耳目达、TCL、维海德、开得联、皓丽、大华以及华创等多家知名厂商的会议室硬件中。
生态伙伴超300家,与厂商联合推出多款硬件
本届InfoComm现场,多家参展厂商均在醒目位置展示了与腾讯会议合作的硬件解决方案。
例如,MAXHUB展示的腾讯会议Rooms21:9超宽屏沉浸式剧场布局,以及罗技展示的腾讯会议Rooms会议室三屏异显方案,能让参会者在不同屏幕中获取更多信息。其中,MAXHUB 视讯智真款 V7 21:9超宽屏在显示16:9屏幕共享内容的同时,左侧面板可展示文字聊天内容,右侧展示实时语音转写和翻译内容。
与poly联合展示的腾讯会议Rooms分体式+MRA方案,则为企业传统的会议终端扩展出更多新能力。在保护企业硬件资产投资的同时,让参会者更聚焦内容讨论。
在教育场景,腾讯会议与耳目达、维海德共同打造的AI培训教室方案,通过实时音视频能力与设备,支持跨校区、跨校际、跨国家教学交流,助力师生之间的高效互动交流更聚焦课程内容本身,课堂笔记交给智能纪要,让思考更沉浸。
在应急指挥场景,基于腾讯会议Rooms的多流能力,亿联推出的Meeting Board 65大屏,可以帮助指挥大厅看清远程指挥中心每个人的工作状态,有效提升工作沟通效率。
目前,腾讯会议的合作伙伴数量已超过300家,涵盖销售生态、硬件生态、天籁生态、ISV等多种场景,并涵盖多种场景解决方案。
腾讯会议于2019年11月上线,至今已稳定服务超25亿次协同,支撑了海量的办公、教学场景,助力各行业的办公人群实现日常办公、远程问诊、金融路演、互动营销等场景线上化,并推动线上教学、智慧教室成为教育行业的常见配置。在腾讯会议的助力下,大量企业实现提质增效。例如,助力腾讯公司自身一年节省成本5.7亿元。
IDC报告显示,腾讯会议位列中国云视频会议行业企业级市场第一。目前,腾讯会议已经广泛服务金融、互联网、教育、医药、工业制造等行业,包括中国人民银行、清华大学、国家电网、中国交建、中国银行、美的、卫龙、国泰君安证券、北京朝阳医院等众多企事业单位,在多个行业的头部客户渗透率超过50%。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。