由上海大学团队研发的沪语大模型“小沪”迎来2.0版,为助老服务提供更多可能。
3月10日,在上海大学主办的“当上海话遇到大模型——助力上海城市数字化转型”研讨会上,大模型“小沪”声情并茂地朗读了一段《再别康桥》,平仄腔调甚有韵味。当现场嘉宾向小沪抛出问题“上海是个什么样的城市”“上海话中的‘大小姐’和‘小大姐’,你晓得有啥不一样的区别吗”时,“小沪”在短暂思考后,给出了一段段准确且略显俏皮的语音回答。
澎湃新闻()记者通过调查了解到,“小沪”于2024年11月9日由上海大学中文学科团队发布,专注听、说、读,能够开展沪语朗读和普通话朗读,普通话-沪语自由对线版本的“小沪”实现了沪语与沪语之间的自由交流,并开发出女声沪语、男声沪语、童声沪语等不同性别和年龄的沪语版本,也具备包括英文、日语、韩语、德语在内的七种外语能力。
上海大学文学院博士研究生范天玉介绍了大模型开发过程中的曲折与突破:“大模型开发的三要素是算法、算力和数据集。我们在训练中遇到的最大困难就是数据集的问题,因为方言大部分是口头表达,文本数据较少,而大模型要输入文字符号,且七大方言区中,吴语使用人口也是最少的。此外,上海话在语音、词汇和语法系统上呈现出明显的层次性特征,也是建立高质量数据集的难点之一。上海大学虽然有丰富的原始语料,但要转化为可用于人工智能训练的格式,仍需大量人力物力。”
范天玉表示,研发团队计划将“小沪”做成端到端大模型,而非纯粹的语言模型,因此就需要的计算成本会更高。后续会继续优化训练数据集与算法,优化端到端的数字人响应速度,提升语音合成的情感表达能力,实现更接近真人、更生动化的表达。
“我们希望小沪不是冰冷的AI系统,而是像真正的上海爷叔、上海囡囡一样去讲话。提高小沪的情感表达能力,是为了让老年人可以感觉到在和一个具有生命力、有情感共鸣的生命体在交互。未来将尽快发布端到端大模型,让每一个人都可以接入,让小沪真实参与到城市治理、助老服务之中,希望帮助不习惯或不擅长使用普通话的老年人群体能够流畅交流,以上海话大模型补齐上海城市数字治理的拼图。”上海大学党委常委、宣传部部长曾军说。
活动现场,上海大学校党委副书记段勇表示,“小沪”的诞生,是上海大学在服务上海城市数字化转型方面的一次积极尝试,也是在新一代人工智能技术与民间传统文化融合方面的有益探索。未来,学校将深化“小沪”的建设和应用,充分的利用“自强5000”超算中心、“千学百科”AI智慧平台等技术资源,为“小沪”的训练、优化和应用提供坚实的技术支撑,让“小沪”成为上海城市数字化转型中的鲜活创新案例。
此外,3月10日也是上海大学海派文化研究中心一年一度组织策划的“310-与沪有约”海派文化日。上海大学海派文化研究中心主任、上海市委宣传部原副部长陈东在活动中表示,上海话承载着上海人民的集体记忆和独特情感,保护和开发上海话不仅是为了保留一种语言形式,更是为了传承一份文化基因,践行城市精神。在数字化转型的浪潮中,“小沪”的研发正是为了探索上海话在现代社会中的新应用,成为连接过去与未来的桥梁。返回搜狐,查看更加多