通义听悟
作为通义家族的一员,通义听悟依托通义千问语言模型、音视频AI模型能力,为用户带来音频和视频内容记录和阅读的全新体验,成为在工作和学习中的AI助手,让每个人都能亲身去体验AI功能给我们带来的效率提升和灵感迸发。主要面向以下五类场景:
企业办公:OA、IM、CRM等各类办公系统中集成通义听悟,可为企业提高会议、面试、访谈、培训、客户交流等场景的信息提取效率。交流内容可回溯、交流重点可查询、相关内容快速定位。
在线教育:可将在线课程进行知识点总结、授课主题划分、添加课程字幕。尤其在录播课场景,快速定位回看,一学期的知识点可快速检索定位。二次挖掘授课视频的价值,提高复习的针对性。
网盘及媒资库:对存储的音视频内容进行转写、翻译,并提炼核心内容与章节定位,“阅读”音视频文件,提高信息转化效率。
金融与媒体:访谈、演讲、路演等交流内容的转写与总结。
销售客服:对话音频内容转文字并进行服务质检,提取客户需求、购买意向,以及问题反馈等重要信息,提升销售成交率。
支持音视频信息处理与提取所需的多种AI能力。除语音识别、翻译、说话人分离外,还包括章节速览、大模型摘要总结(全文摘要、发言总结、问答回顾、思维导图)、要点提炼(关键词、待办事项、重点内容、场景识别)、服务质检、PPT提取及摘要、口语书面化、自定义prompt等功能。