阿里云通义听悟日前迎来升级，新增三项功能

2024-11-22 发布

继此前在今年6月发布基于通义千问大模型打造，集语音识别、自然语言处理、文本生成于一体的AI产品AI通义听悟，并启动公测后。日前阿里云方面宣布，通义听悟已于近期完成升级，在原有实时记录、音视频文件转写、全文概要等功能基础上线了三大新功能，其中包括国内音视频AI领域首创的视频自动提取PPT，以及浏览器插件、小程序扩展等，旨在帮助用户在PC和移动端随时随地听懂、理解、阅读各类音视频内容，提升职场人士和学生的工作学习效率。

据了解，通义听悟是国内首个开放公测的大型模型应用产品，且应用场景广泛，可以用于教育、娱乐、新闻等多个领域。同时通义听悟还具有高度可定制性，用户可以根据自己的需求对其进行个性化设置，例如用户可以选择特定的主题领域，以便通义听悟能够提供更加精准的内容推荐。

阿里云CTO周靖人此前曾表示，“我们的目标是让通义听悟成为用户工作学习的AI助手，专注于具有高知识附加值的音视频内容场景。通过运用先进的自然语言处理技术，通义听悟能够将音视频内容转化为易于理解的文字，帮助用户快速掌握关键信息”。

据悉，通义听悟此次新增的自动提取PPT功能通过引入视觉AI算法，可自动将PPT讲解视频分割为演示文稿，并对每页PPT进行要点总结，形成一份图文并茂的大纲，帮助用户解决培训、网课学习等场景“求PPT难”的问题。

而Chrome和Edge浏览器插件则可帮助用户全程录制会议、网课、直播、视频等内容，并实时生成双语字幕。在移动端，通义听悟钉钉和微信小程序不仅支持PC端的基础功能，还可一键转写手机和聊天记录的音视频文件，用户仅需一部手机即可记录、回顾和整理音视频内容。

值得一提的是，为了让更多用户体验到这些功能，此次新功能上线期间，阿里云方面将继续联合各大平台和社区推出定制口令码，用户根据口令码可随机抽取20h、30h、66h、88h、100h的免费转写时长。

对此阿里云方面表示，作为集成该公司先进的语音、语言和视觉AI技术的产品，通义听悟未来还将陆续上线适用于更多场景的新功能。通义听悟产品及研发负责人鄢志杰则表示，“继语音AI与大语言模型碰撞出火花后，我们持续将视觉AI引入通义听悟这一创新产品，围绕人们工作和学习中的音视频内容，希望通过全新的体验成为大家的AI助手”。

声明：本页面内容源自互联网，不能用于任何商业服务,也不可作为任何信息依据,更无法构成专业建议，我们无法确保该内容的时效性、准确性和完整性，仅供读者参考。严禁使用和转载与分享该内容。本站对该信息不承担任何责任，内容和图片有误或涉及其他问题请及时与本站联系处理。