AI超拟真有声书还原度有多高

罗曼罗兰曾经说过:“和书籍生活在一起,永远不会叹气。”热爱读书也是传承在一代代中国人中的优秀传统,当下,国家也在不断开展推广全民阅读的工作。

近些年,随着网络和新媒体的迅猛发展,人们获取知识的途径得到了空前的拓宽,阅读方式也发生了很大的变化。根据第七届中国数字阅读大会发布的《2020年度中国数字阅读报告》,全国数字阅读规模用户已经突破了4.94亿,其中有声书人均阅读量达到6.3本,发展尤为迅速。

有声书有着传播速度快、阅读便捷、读者受众广泛等优点,但另一方面,制作成本和使用体验的平衡还比较难以把控,导致有声书优质内容产能不足,制约着行业的发展。

目前,有声书内容制作主要有人工录制和机器生成两种方式。真人朗读在艺术表现力上有着很大的优势,但制作成本十分高昂,在部分平台上已经高达每分钟30元,如果录制的作品篇幅较长,那么成本很可能高达数十万元。

而通过机器生成有声书内容能够让制作成本下降约90%,是一种生产效率和性价比都更高的方式。并且,随着语音合成等技术的不断成熟,机器生成的朗读声音已经十分接近人声表达的效果,因此已经广泛应用到了人文知识、科学技术等科普类型的有声读物生产中。

而针对文学性、表现力更强的小说类作品,机器生成语音的潜力还有待发掘。一方面,这类作品对生成语音的表现力要求更高,另一方面,小说类作品中往往有较多人物,需要将他们区分开来,而这也离不开先进的AI技术。

在此背景下,腾讯PCG AI交互部旗下的音视频创作平台——“声咖”就依靠深厚的AI技术积累,首发了针对有声小说配音的AI制作功能。该功能目前限时免费,一个人就能完成整本有声小说的制作,将文本录入后即可通过AI生成配音,让有声书制作的成本大大下降,效率也能大幅提升。

另外,这项功能也能让所有用户都能够根据自己的喜好,免费创作出富有代入感、沉浸感的有声书,从而满足更多元化的有声书需求。

声咖的使用方法非常简单,将txt、doc等常见格式的文本导入,选择相应的AI配音,即可进行有声朗读。无论选择哪种AI配音,如果不特别注意听的话,真的可能会以为这是真人朗读的效果。

AI超拟真有声书还原度有多高

AI配音、声音风格、方言等都可以随时更换

当然,由于中文丰富的表达性,全靠AI生成的效果难免会有些瑕疵,例如在我们测试的这段文字中,“茅椽蓬牖”一词中最后两个字就出现了停顿,另外“待在下将此来历注明”中的“待”也被发成了一声。声咖针对这些问题进行了良好的优化,用户能够通过词组连读、多音字等功能,很方便地对音频进行调整。此外,插入停顿、局部变速、单词读法等功能,让效果变得更生动、更具细节。

AI超拟真有声书还原度有多高

选中任意区域后,都可以对朗读效果进行微调

而针对角色较多的小说,声咖还有非常有特色的有声小说创作功能。上传小说文本后,系统会通过NER算法自动识别小说中的角色,再通过“正则表达式“自动分好章节。其识别速度也是非常快的,《基督山伯爵》这种百万字的长篇小说所花时间也就30秒以内,这之后用户就可以根据自己对角色的理解为其选择AI配音了。声咖采用了跨说话人的风格迁移技术,让同一个AI配音演员能够演绎出不同的情感乃至方言。

AI超拟真有声书还原度有多高

每种AI配音员下都标明了适合的作品风格

进入编辑界面后,左侧章节、右侧角色的布局一目了然。如果有一个角色有多个名字(例如本书中的唐太斯、艾德蒙和基督山伯爵),或是由于表述方式而造成的重复识别(例如下图中的腾格拉尔先生和腾格拉尔),那么用户也可以方便快捷地为其选择相同的AI配音。此外,如果出现部分无名角色所说出的台词,也可以手动添加角色或是选中单句专门添加配音。

AI超拟真有声书还原度有多高

角色识别准确率非常高,所有出场角色基本都已覆盖

就拿《红楼梦》中经典的“林黛玉进贾府”一段为例,我们为黛玉、贾母、王熙凤三位主要角色分别选择了温婉、成熟、亲切三种AI配音声线,而旁白则选择了较为浑厚的男声。这其中王熙凤又以思维敏捷,说话利落著称,因此我们就将她的部分台词做了加速处理。如此一来,本就表现力极强的文字,在声音的加持下更显得活灵活现,更让人印象深刻。

AI超拟真有声书还原度有多高

每名角色的台词前都有显眼标记,方便对单句进行调整

许多长篇小说,都有十几个甚至数十个角色,如果单靠人力手动选择匹配的声音,耗时又耗力。而声咖的有声小说功能能够快速分辨不同角色,并通过不同的配音加深用户对每名角色的印象,这也体现了AI技术的发展对于用户阅读体验和阅读效果的革新。

随着生活方式的变化,消费者的阅读方式和阅读场景也都呈现出了更为多元化的趋势,数字化阅读展现出了越来越强的潜力。这其中,就属更便捷、情感更丰富的有声书发展前景最为广阔。

以大数据、5G、AI为代表的新一代信息技术正在飞速发展,应用场景也在不断拓宽,从而推动着各行各业的转型、升级和融合。有声书行业想要发展,也必然离不开技术的赋能。声咖就是一个技术为行业赋能的优秀案例,通过AI技术的加入,让有声书的制作成本大大降低,也便于批量生产内容,有助于在短时间内快速提升有声书行业的经济效益,形成规模效应。

而对于内容创作者来说,无论是对名著的二次创作还是对自己作品的“有声化”,声咖都提供了一种革新的解决方案。这样产出的内容,不仅满足了时下大众对有声小说的需求,也更适合推广到老年人、青少年、视障人士等特殊群体之中,改善他们的阅读现状。

原新闻出版总署副署长李东东表示:“面对数字化发展新趋势,要大力推进数字化阅读发展,建立全民阅读数字资源平台,推进数字化阅读服务。”而腾讯PCG AI交互部的声咖就是一个“阅读+技术”的优秀应用案例,它让用户能够随时随地、随身随心地获得专业优质阅读内容。这对于全民阅读的推广,也必将起到十分积极的作用。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 86345@qq.com 举报,一经查实,本站将立刻删除。
(0)
上一篇 2022-04-21 00:20:36
下一篇 2022-04-21 10:20:48

猜你喜欢

  • 面对世界第一他真的尽力了

    奥运会羽毛球男单,第一轮输给石宇奇出局的索伦。然而即便是面对积分排名世界第一的石宇奇,索伦依旧拼尽了全力。 回看索伦三届的奥运会,2016里约遇李宗伟,2021东京遇石宇奇, 20…

    2024-07-29
  • 女子3万6卖掉亲生儿子获刑5年

    2022年4月,被告人周某在网上认识了张某,知道张某想养个孩子后,周某在丈夫不知情的情况下,收取张某夫妇人民币36000元,将刚满五个月的儿子卖给了张某夫妇抚养。丈夫在外务工,想和…

    2023-04-16
  • 杨洋王楚然恋情疑似曝光

    酝酿了这么久,都说这是今天最大的瓜,结果只是实锤了此前被爆料过的恋爱。 5月10日中午十二点半,狗仔刘大锤直播爆料顶流恋爱,此前他声称赌上自己的名声爆料顶流谈恋爱,他还爆出一张流量…

    2023-05-10
  • 外交部:对坂本龙一去世表示哀悼

    坂本龙一(资料图) 海外网3月15日电 日本音乐家坂本龙一15日在日媒《东京新闻》上刊文,批评日本政府处理核电站问题的错误举措,并警告人们不要忘记福岛核电站悲剧。 日本政府不顾民众…

    2023-04-03
  • 专家建议:适当降低按揭贷款利率

    每经记者:肖世清 每经编辑:马子卿 4月20日,央行授权全国银行间同业拆借中心公布,1年期LPR为3.65%,5年期以上LPR为4.30%,两项贷款利率均与此前保持一致。截至目前,…

    2023-05-21
  • 福建新增本土“112+72”

    记者从福建省卫健委获悉,3月19日0至16时,福建省新增本土确诊病例112例(泉州95例,莆田13例,厦门3例,漳州1例,其中无症状转确诊3例),新增本土无症状感染者72例(泉州6…

    热门资讯 2022-03-19
  • 唐山打人案抓捕细节:公安部部署

    8月21日上午8:30,山东省东营市东营区人民法院的法庭内气氛庄重,陆陆续续有旁听人员安静入场。当天,曾经轰动石油城的吴长伟等29人涉嫌组织、领导、参加黑社会性质组织罪案一审即将公…

    2022-06-12
  • 拜登:得州小学枪击是场“大屠杀”

    “仇恨是美国灵魂上的污点!”当地时间15日,美国总统拜登在国会大厦举行的年度执法活动上再度谈及纽约州布法罗市超市发生的大规模枪击案,并呼吁美国人“必须共同努力消除仇恨”。纽约州官员…

    热门资讯 2022-05-25
  • 董宇辉回应8穗玉米卖50元

    一根玉米卖6元! 董宇辉回应新东方卖的农产品贵,是因为谷贱伤农。 谷贱伤农这话没毛病。 但是,要看怎么理解,他是站在谁的立场上说的? 是为农民说话,还是为直播平台叫屈。 如果是为农…

    2022-09-23
  • 拜登就“佩洛西访台计划”表态

    据美国《国会山报》消息,美国总统拜登当地时间20日就“佩洛西访问台湾计划”表态,他表示,美国军方对有关佩洛西赴台计划的报道表示担忧。中国外交部发言人20日明确表示,中方要求美方不得…

    热门资讯 2022-07-21

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注