通义听悟

作为通义家族的一员，通义听悟依托通义千问语言模型、音视频AI模型能力，为用户带来音频和视频内容记录和阅读的全新体验，成为在工作和学习中的AI助手，让每个人都能亲身去体验AI功能给我们带来的效率提升和灵感迸发。主要面向以下五类场景：

企业办公：OA、IM、CRM等各类办公系统中集成通义听悟，可为企业提高会议、面试、访谈、培训、客户交流等场景的信息提取效率。交流内容可回溯、交流重点可查询、相关内容快速定位。
在线教育：可将在线课程进行知识点总结、授课主题划分、添加课程字幕。尤其在录播课场景，快速定位回看，一学期的知识点可快速检索定位。二次挖掘授课视频的价值，提高复习的针对性。
网盘及媒资库：对存储的音视频内容进行转写、翻译，并提炼核心内容与章节定位，“阅读”音视频文件，提高信息转化效率。
金融与媒体：访谈、演讲、路演等交流内容的转写与总结。
销售客服：对话音频内容转文字并进行服务质检，提取客户需求、购买意向，以及问题反馈等重要信息，提升销售成交率。

支持音视频信息处理与提取所需的多种AI能力。除语音识别、翻译、说话人分离外，还包括章节速览、大模型摘要总结（全文摘要、发言总结、问答回顾、思维导图）、要点提炼（关键词、待办事项、重点内容、场景识别）、服务质检、PPT提取及摘要、口语书面化、自定义prompt等功能。