恐怖谷!哥大华人打造「人脸机器人」,表情逼真到让人毛骨悚然

阿菜 热点要闻 2024-04-01 09:04:35

在科技领域,OpenAI机器人虽然理解力强大,但却无法进行非语言交流。然而,哥伦比亚大学的华人团队却成功打造了一款全新的机器人Emo,具备了预测和模拟人类表情的能力,甚至可以进行眼神交流。这款机器人的逼真程度让人感受到了真正的「恐惧」。

Emo的自我监督学习框架让它能够像人类照镜子练习面部表情一样,快速准确地预测人类表情,并与人类同时做出表情。有趣的是,Emo甚至可以在一个人微笑前840毫秒提前预测,并与人类一起微笑,让人感受到机器人的真诚和被理解的感觉。此外,Emo还可以进行眼神互动,这在非语言交流中扮演着重要的角色。

为了实现这一切,研究团队面临着诸多挑战。首先是硬件方面,他们需要设计一个涉及复杂硬件和驱动机制的多功能机器人人脸,让其具有表现力。其次是设计好的机器人脸需要知道生成哪种表情,让其看起来自然、及时和真实。为了训练机器人能够预测人类的面部表情,并与人同时做出这些表情,Emo脸部配备了26个执行器,可以呈现出多种多样的微妙面部表情。此外,Emo的脸使用了硅胶皮设计,方便快速定制和维护,为了更加逼真的互动,研究人员为机器人的眼睛配备了高分辨率摄像头,使其能够进行眼神交流。

Emo的面部控制结构设计独特,配备了26个执行器,提供了更高的面部自由度,可以做出不对称的面部表情。通过磁铁连接的连杆控制眉毛、眼睑和眼球的运动,Emo的眼睛内嵌摄像头,实现了仿人视觉感知。这些设计让机器人能够与人类进行更自然的面对面互动,实现正确自然的注视,是近距离非语言交流的关键元素。

研究团队还开发了一个升级版的逆向模型,使机器人在相同的计算硬件上生成电机指令的速度比上一代产品快五倍以上。通过自我监督学习过程,机器人可以在没有明确的动作编排和人类标签的情况下生成人类面部表情。这种方法让机器人能够通过观察人们面部的微小变化,来预测他们的面部表情,从而实现更加逼真的互动。

Emo的下一步计划是将语言交流整合到其中,接入大模型如ChatGPT,使机器人的行为能力越来越像人类。随着机器人技术的不断发展,团队也将关注背后的伦理问题,确保机器人能够无缝地融入人类的日常生活,为人类提供更多的陪伴和帮助。在未来的世界里,与机器人互动将变得像与朋友交谈一样自然和舒适。