让机器更“懂”人类(新职·新知③)

新华社记者付聪在马路边收集响声数据信息。

张嘉幸摄

打开计算机，将收集的消息、雨的声音、溪水声等响声数据传送，“清理”掉参杂期间噪音，对助听数据库系统开展“练习”，测试模型在真实情景的敏感度……伴随手指头敲击键盘的“啪嗒啪嗒”声，腾讯官方天籁之音试验室人工智能训练师付聪一天的工作从此逐渐。

近些年，伴随着人工智能应用飞速发展，这一被称作人工智能训练师职业慢慢发展壮大。做为“数据职业类型”之一，人工智能训练师的诞生，加快了人工智能技术由项目研发迈向应用领域的一个过程，会带来相对较高的经济效益和价值。

为实体模型持续“喂”数据信息

每天出门时，付聪总是会在耳后戴一个大“耳饰”。

这一“耳饰”其实是一个公测版的助听。“耳饰”中的响声各种各样，有呼呼噪音，有锐利吱吱声的嘈杂声……这种通过助听变大时产生的噪音，是许多带助听器的听障人士长期性遭遇的困扰。

付聪和他的团队已经试着运用计算机算法、根据人工智能应用“练习”数据库系统，让助听更为“聪慧”地减低噪音，让听障人群听得清、能听懂、听到舒适。

付聪解释道，助听数据库系统不大，所以需要对于不同的场景进行改善，许多情景充满激情，“比如一个听障人士在饭店吃饭，周边很多人讲话，他想要跟对面的人闲聊，四周响声尤其噪杂，做为一个正常人都会没听清楚，何况一个有听障得人？我希望运用实体模型，把必须的声响分离出来，减少噪音，让更多听障人群”。

理想是美好的，但是现实的模型算法研究过程却像是一场不断所进行的“战争”。

模型研究过程主要分为下列两步：数据收集、数据信息“清理”、模型推理、场景测试、调节优化算法，经过几次迭代更新之后再去检测、调节，“假如检测结果不太理想，需要将这一过程再走一遍，直至获得最佳实际效果”。付聪说。

数据收集要切合实际。为了能让实体模型更“聪慧”，必须对于不同的场景收集各种各样独特数据信息。付聪和团队人员既需要到早晚高峰地铁、繁华喧天的酒店、车水马龙的大马路等场景，收集数以百计小时响声数据信息，还需要戴着助听感受这种响声的差异，“例如消息，平常人听见是呜呜声，但戴着助听之后，是很吵的噗噗声，好像去KTV歌唱，响声用劲砸到了话筒上”。路面骑车、海滩大风大浪……为了能收集各种各样车噪数据信息，付聪录了多种多样场景下的消息。

数据信息“清理”是把没有用的数据信息“洗去”。付聪举了一个案例——消息，真实情景下能参杂汽车鸣笛声、人聊天等响声。在整理时要将这些信息去除出去，保存一个比较单纯的消息，那样实体模型才能“了解”风。

模型推理是把“清理”好一点的数据信息“喂”给实体模型。除开收集的独特数据信息，付聪与他的同事还会继续添加例如世界各地的思维和语言一些非视频语音响声等相关信息，“基本上包括了大家生活中遇到中的所有噪音和视频语音”。

与人类不一样，人工智能模型在练习环节中，不容易疲倦、心烦、闹脾气，它们“聪慧”在于网络参数、练习对策、信息量等。“他们就像一个‘小孩’，就会越来越‘聪慧’，鉴别到越来越多响声，我特别有成就感。”付聪说。

考验耐心、细腻和忍受力

模型推理结束后，并不是寓意马上能运用到听障人群助听上，还需要亲身经历很长时间的迭代更新、调节全过程。

例如，为了能让听障人群兼容到适宜的助听，传统式方式就是病人不断到线下的验光配镜店去试带，全过程复杂。付聪解释道，一般情况下，依据病因不一样能将听力损伤分为三类：感音神经性、传导性耳聋、混合性耳聋；依据听力损伤的情况不同，分成轻微、轻中度、中重度及极重度耳聋。根据不同的种类，助听的兼容方法各有不同。

有没有可能把兼容全过程搬至“网上”，运用人工智能技术和机器学习专业能力，让听障人群通过线上就可以做准确的英语听力验光配镜？带上这样的疑问，付聪逐渐产品研发兼容优化算法。他把这一过程比喻成做数学应用题，必须查看世界各国参考文献、查找目前计划方案，根据实际的使用场景，充分利用专业知识进行合理想象、设计实验、寻求答案。

这一过程磨练人工智能训练师的细心、细腻。在检测助听音色时，不同类型的佩戴方式，拥有不同的检测结果。付聪与同事必须以“N×N”排列与组合设计方案不同类型的佩戴方式，而且反复重复实验，来探讨其对于音色带来的影响。

这一过程十分磨练人工智能训练师的忍受力。“一个人工智能训练师的基本职业素养，便是逼迫自己听好多次尖锐的声音。”付聪表明，主要是因为宠物训练师必须定量分析考量听力障碍病人可以正常听见的声响极限点，但这些音乐的分贝数是平常人耳无法忍受的，“有些时候总想把手机耳机磕掉。通过一天检测，全部脑壳都觉得疼”。

通过持续迭代、调节，搭载了算法助听顺利完成了。最令付聪最难忘的就是他们第一次到广东韶关捐助商品，他把助听逐个交给听力障碍老年人手里，启动、戴机器设备、调节增益值……“尽管我模型拟合充满信心，但那时候是感觉心提及了嗓子眼儿，由于在这以前，老一辈人是不能正常沟通的。”付聪说。

他小心翼翼地了解一个老人：“你们可以听见我在说什么吗？”

“就行了。”老年人迟缓又很坚定不移的从嘴里讲出3个词。

“那时候的我感觉，我们要做的这件事情挺有意义的。”付聪说。

用技术处理人类的需求

人工智能训练师是一个需要面对孤独职业，因为她们很多时间是在设计、敲代码、获取数据、训练算法中度过。

“我击败寂寞的秘密是兴趣爱好。”付聪的学院是通讯，其中不少课和信号分析有关，平时较为爱好音乐，因而就把自己的爱好与专业、工作中结合在一起，对焦声频行业，大学毕业之后参加了许多相关声频信号分析工作，经历过声频优化算法从传统算法到人工智能技术，再从规模性深度学习的不同阶段。

在付聪看起来，人工智能应用是一个很好的专用工具，目地是把人类从许多用脑中解脱出来，用产业化的方式来取代现阶段费用较高的个体劳动。对全社会来讲，这是一种生产力水平发展，有着极大的社会效益和经济收益。

完善的人工智能应用是什么样子的？付聪觉得需经过3个步骤：一是感知智能，关键就在于仿真模拟视觉感受、触觉和嗅觉等感知力，例如面部识别、语音识别技术等；二是认知智能，具备人类思维了解、知识共享、行为协作或博奕等特性，“可以更好的理解他人说的啥，依据一些提醒，给予相对性完整的回应”；三是个人行为智能化，其实就是像无人驾驶一样，真真正正还可以在现实世界充分发挥。

做到这种总体目标，必须对人工智能模型持续进行练习。付聪表明，首先要对存在的问题提前准备足够多数据信息，“真的太多了尽可能包含解决这些问题时遇到的全部情况”；次之必须设计方案非常好的优化算法，并依据用户满意度逐步完善。

“人工智能应用行业日新月异，规定人工智能训练师有开阔的视野、浓厚的人文精神和责任感，用业内全新念头、理念与正确伦理思想来协助人们处理生产制造生活中遇到问题。”付聪说。