珠海业勤税务师事务所有限公司珠海业勤税务师事务所有限公司

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

硅基智能创始人司马华鹏:所有使用AI的人,应该专注到人类特有的东西

“大家好(hǎo),我(wǒ)是刘强东,今天 是(shì)不是看起来有些不同(tóng)?很久没直播,还有 些许紧张……话不(bù)多说,老刘的数(shù)字直播带(dài)货现在开始。”4月16日(rì),京东创始人刘强东在京东(dōng)平台开启数字人直播。

“东(dōng)哥”数字人直播,迅速引起广泛(fàn)关注,数字人替代(dài)真人直播的时(shí)代来临了吗?

4月18日,数字(zì)人(rén)头部厂商硅基智能创始人司马华鹏接受了《每日经济新闻》记者的专访(fǎng)。司马华鹏(péng)表示:“刘强东这次数字人直播,对我们行业是非常(cháng)大的(de)品(pǐn)牌(pái)宣传。他使用(yòng)(数字人直播),说(shuō)明这个行业得(dé)到了一(yī)次非常重要的(de)认可。”

对于AI的(de)使用,司(sī)马华鹏建议(yì):“未来所有使用AI的人(rén),应该专注到人 类特有的东西(xī),比如创意,比如有(yǒu)温度的东西。”

拆解数字人技术

“数字人刘强东”是否有硅(guī)基智能(néng)技术的支持?司马华鹏表示:“我们不太方便(biàn)对外公开,但这些技术最早(zǎo)的开创者(zhě)肯定是我们。我(wǒ)们在整个(数字人)直播(bō)上(shàng)大概有40多项发明(míng)专利,在申请的也有几十项。现在行业内有很多在使用我们(men)的技术授权,也有(yǒu)很多(duō)在使用硅(guī)基(jī)智能的API(应用(yòng)程序编程接口)。”

“东哥”数字人究竟是如何打造出来的?司马华鹏介绍:“它(数字人)这些内容(róng)是用AI渲染出来的。如果现在想做(zuò)东哥同款,你需要提供几分(fēn)钟的视(shì)频。然后我们会(huì)将其(qí)训练成一个数字人模型。这个数字人模型背后(hòu),将由大模型驱动它。定时去上一(yī)些(xiē)产品、定时回复一些客户需求、定时作一些记录,这些(xiē)都是事(shì)先做好的剧本,这(zhè)些剧本实(shí)质(zhì)由 大模 型(xíng)驱动,比较接近于(yú)人类(lèi)的行为和(hé)反馈。”

那么(me),除(chú)了上述AI渲染技术外,数字人直播还需要哪(nǎ)些技(jì)术支持?司马华鹏(péng)称:“我们的大模型是多模态的,是文(wén)本(běn)生成、声音生成(chéng)和数字人生成的结合。其实(shí)很多人在反(fǎn)馈,他(刘强东)声音和节奏(zòu)感与他(tā)原来讲话不太一样。这很可能克隆的(de)是平时的语速,但是直(zhí)播(过程中),一个用户停留时 长是比较短的,你必须在(zài)很短时间内把大量的信(xìn)息披露出(chū)来(lái),所以必须把(bǎ)声音放得快一些。”

对于语音合成(chéng)技术,司马华鹏表(biǎo)示(shì):“我们全部技术(shù)都(dōu)是(shì)自己的(de)。从目前端到端的生成(chéng)来讲,(语音合成)已经是一个非常成熟的技术(shù)。”

数字人(rén)形象、语音合成,都是外在展现形式,数(shù)字人直播内容仍旧离不开文本。对于(yú)文本,司(sī)马华鹏称:“文本大模型方面,我们基本(běn)上都(dōu)是原创的(de)技(jì)术,最近‘炎帝’大模型刚刚通过网信办的备案。”

能(néng)否替(tì)代真人直播?

目前,大家看到的直(zhí)播带 货,很(hěn)可(kě)能就是数字人。司马华鹏介绍:“我们在2021年开创(chuàng)AIGC直(zhí)播的(de)大方向,(刘强东数字人(rén))基本上是我们2023年产(chǎn)品能够呈现出来的效果,这样的(de)直播间我(wǒ)们已经卖掉了上万个,京东、淘宝、抖音、快手和视(shì)频号平台都有。”

真人直播会面临各种复杂场景 ,特别是情感交流(liú),数字人可以做(zuò)到吗?司马华鹏表示:“我(wǒ)们在看东哥直(zhí)播的时候(hòu),会不(bù)会把他(数(shù)字(zì)人)当作真正的(de)东哥来看,这是决定数字人智能化程度的重要标志。从开播到现在,行业有非常(cháng)多 的评价,大家觉得还是能看到一(yī)些机械的(de)痕迹。”

“这个(数字人)行业发展的(de)核心就是‘看不出来(lái)’。”司马(mǎ)华鹏强调。

其认为(wèi)周末突发!穆迪下调评级,万科坚决反对!:“我们现在也有大量的直播间,效果比这个(刘强东数字人(rén))要好很多。如果他这个直播不(bù)是在自(zì)家平(píng)台,而是在其他平台,很容易被机(jī)器识别出来,很快就会被限流。”

因 此,在司马(mǎ)华鹏看来,数字(zì)人行业的(de)核心是让整(zhěng)个(gè周末突发!穆迪下调评级,万科坚决反对!)直播间 符合图灵测试。对于(yú)数字人行业的发展,其认为:“(该领域)图灵测试1.0是分不清(是人类还是(shì)AI);图灵测试2.0则是双向情感交互;图灵测试3.0就是‘死生相(xiāng)契’,未(wèi)来我们与AI之(zhī)间,可能是Soul Mate(心灵(líng)伴侣(lǚ))的关系,它是你非常(cháng)重要的助手、朋友(yǒu),也可能(néng)是你亲密 的合作伙伴。”

目前,很多问答式大模型主要给受众(zhòng)提供专业类辅助,但若诉(sù)诸(zhū)情感,是(shì)否兼具图像、声音和文本的(de)多(duō)模态大模型更具优势?对此,司马华鹏表示(shì)认可。“人类大脑的设计中,90%以上是针对图形,所以(yǐ)我们(men)说有图有真相(xiāng)。基于文本,产生的是想象(xiàng)力,(阅读文本)的能力确(què)实非常重要,但对大部分 人而(ér)言,(自己的大脑)生(shēng)成图(tú)片,然后再想象出一(yī)个 空间,还原出这个东西,是非常累的。因此,多模态或者视频化交互能力,能够大大降低我们之间信息 沟通对应的脑力消耗。”

对于未来AI电商的形态,司马(mǎ)华鹏认为,未来更大(dà)的价值是专业 性。比如说,假设我们在(zài)食品领域有一个很好(hǎo)的AI专家,它 可以从数据(jù)、算法(fǎ)的角(jiǎo)度 给我们提供很(hěn)多的专业内容。这样(yàng)的专家,它带来的(de)影响力会超过现有(yǒu)的人类专家,这会带来真(zhēn)正的、更(gèng)好的电商交易(yì)。

其进一步解(jiě)释称:“人类 在做很多(duō)行为的时候,有(yǒu)一定的偏(piān)颇或者偏见,或者带有一定的商业目(mù)的。而以数字和算法驱动(dòng)的AI专家,会成为我们(men)的朋友、我们的伙伴,很有可能(néng)成为AI电商未来的主流。现在这些成本(běn)还比较高,只是出现在奢(shē)侈(chǐ)品(pǐn)领(lǐng)域。我希(xī)望未 来(lái)每一类小产 品上,都有这样一个专家顾问,来给我们提供非常好(hǎo)的沟 通交流方式(shì)。这是AI电商未来非常重要的一部分。”

未经允许不得转载:珠海业勤税务师事务所有限公司 周末突发!穆迪下调评级,万科坚决反对!

评论

5+2=