“換個角度”往往是顛覆性創(chuàng)新的起點

3周前來源：科技日報觀看：19

3月29日，2025中關(guān)村論壇年會——第十四屆吳文俊人工智能科學技術(shù)獎頒獎典禮將科技進步獎特等獎授予京東科技信息技術(shù)有限公司、中國科學技術(shù)大學等共同完成的“多模態(tài)交互式數(shù)字人關(guān)鍵技術(shù)及產(chǎn)業(yè)應(yīng)用”項目。中國工程院院士、清華大學信息學院院長戴瓊海在頒獎典禮上評價，獲獎團隊通過產(chǎn)學研合作推動數(shù)字人技術(shù)應(yīng)用，為數(shù)字經(jīng)濟的發(fā)展樹立了標桿。

“能打動評委的，或許不是形容數(shù)字人逼真度的一系列量化指標，而是真真切切呈現(xiàn)在他們面前的、讓人一時真假難辨的數(shù)字人本身。”特等獎團隊負責人、京東探索研究院院長何曉冬告訴科技日報記者，特等獎不是每年都有，要在一等獎的基礎(chǔ)上再評審，只有得到絕大多數(shù)評委的認可才會被授予。

3年前，普通人要擁有一個和自己長得像、說話像的數(shù)字人幾乎是不可能的，寥寥幾位名主持人的數(shù)字分身表現(xiàn)也有些僵硬。如今，只需一張照片或很短的視頻，人人都能借助京東言犀擁有“以假亂真”的數(shù)字分身。

換個角度攀登“珠峰”

在虛擬世界“克隆”一個自己，這曾經(jīng)被認為是行業(yè)的一座“珠峰”。2020年，英偉達創(chuàng)始人黃仁勛帶著自己的數(shù)字分身召開發(fā)布會，不到一分鐘的“再現(xiàn)”背后，是幾百個攝像頭采集數(shù)據(jù)、最新的顯卡處理數(shù)據(jù)以及各類計算資源的支撐。

“那時不到一分鐘的數(shù)字分身‘仿真’可能需花費百萬美元。”何曉冬解釋，為了復(fù)刻得像，那時的技術(shù)邏輯是構(gòu)建物理模型，把真實的三維世界的每個表面分割成大量很小的三角形，通過物理模型進行模擬，然后渲染面部表情，這樣需要極大量的計算，且難以滿足實時輸出的要求。

現(xiàn)實世界的逼真再現(xiàn)要處理的數(shù)據(jù)量太大了，這似乎是一個邁不過去的“大山”。

研究團隊沒有選擇“死磕”，而是逆向思維研究起信息的接收方——視網(wǎng)膜。

“人體的視網(wǎng)膜是二維的，我們之所以能感知這個世界，是因為二維的信息在大腦中重構(gòu)出了三維。”何曉冬說，與其先復(fù)現(xiàn)一個刻板的三維世界，被視網(wǎng)膜“降維”再由大腦重構(gòu)，不如直接把“降維”后的影像給視網(wǎng)膜。這樣既解決了重構(gòu)的數(shù)據(jù)量，又沒有影響大腦的感知。

“換個角度解決問題”讓團隊找到了顛覆性創(chuàng)新的“更優(yōu)解”。團隊進一步打磨端到端（無需高顆粒度拆解）的再現(xiàn)技術(shù)，提升了二維的精度，做到讓大腦“滿意”。

在動作的再現(xiàn)上，團隊利用“常識”進一步壓縮計算量。“過去每個動作都要采集，然后再重現(xiàn)，事實上，人類動作大多是常規(guī)的，很少有人像蜘蛛俠一樣行動。”何曉冬說，通過預(yù)建模將“先驗知識”告知給AI，AI在進行動作創(chuàng)造時就會有“依據(jù)”，共同的動作有選擇，個別的動作再采集，降低了處理量，也讓動作更符合常理。

給多模態(tài)數(shù)據(jù)任命“領(lǐng)隊”

“我們瞄準的不是做一個‘展示品’，而是要落地直播應(yīng)用。”何曉冬說，直播要和觀眾互動幾個小時，就要解決人工智能幻覺，聲音、手勢、表情等協(xié)調(diào)的問題，而人對人是最敏感的，哪怕眼珠轉(zhuǎn)動與聲音、儀態(tài)出現(xiàn)一點偏差也會被視為異常。

文生視頻大模型Sora的產(chǎn)品是無聲的，但想應(yīng)用于直播就必須配上聲音。一旦需要配音，虛擬人的聲調(diào)、特有口音、是否與動作匹配等細節(jié)都可能露餡，這些使得多模態(tài)數(shù)據(jù)的聯(lián)動成為必須解決的問題。

如何才能讓數(shù)字人知道說話的時候什么時候該亢奮，什么時候該溫柔呢？

“團隊經(jīng)過討論決定用語音來驅(qū)動‘統(tǒng)領(lǐng)’表情、微動作等其他模態(tài)的信息。”何曉冬說，通過生成一個基礎(chǔ)數(shù)字人，用視覺特征對其進行訓(xùn)練，讓它學會什么時候該輕聲細語、什么時候該聲音激昂，聲音跟它要播報的文字內(nèi)容相匹配，然后再驅(qū)動多模態(tài)的協(xié)同配合，最終生成一個合乎常理的形象。

由于需要長時間播報，團隊還對人工智能的幻覺問題進行了專門攻關(guān)，將人工智能的幻覺率降低到可接受范圍內(nèi)，讓它在相當長的時間里保持逼真的擬人度和情緒。

在計算量降低、降本增效的基礎(chǔ)上，京東言犀數(shù)字人實現(xiàn)了大規(guī)模商業(yè)化，已經(jīng)服務(wù)9000多戶商家、累計創(chuàng)造140億元的經(jīng)濟價值，未來將在文旅、教育、政務(wù)等其他場景落地應(yīng)用。

“我們還將推出來‘千人千面’的數(shù)字人。”何曉冬說，現(xiàn)在大家一場直播中看的內(nèi)容是一樣的，未來每個人根據(jù)喜好可以定制不同的數(shù)字人服務(wù)，在文旅表演等方面都能落地。

換個角度攀登“珠峰”

現(xiàn)實世界的逼真再現(xiàn)要處理的數(shù)據(jù)量太大了，這似乎是一個邁不過去的“大山”。

研究團隊沒有選擇“死磕”，而是逆向思維研究起信息的接收方——視網(wǎng)膜。

給多模態(tài)數(shù)據(jù)任命“領(lǐng)隊”

如何才能讓數(shù)字人知道說話的時候什么時候該亢奮，什么時候該溫柔呢？

點擊展開全文

本文鏈接：http://m.020gz.com.cn/news-2-1532-0.html“換個角度”往往是顛覆性創(chuàng)新的起點

聲明：本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系，我們將在第一時間刪除處理。

上一篇：新DNA顯微鏡“從內(nèi)到外”繪制生命3D圖

下一篇：感受生命科學“最”新成果的震撼

為你推薦

新型光—電鑷實現(xiàn)對物體非接觸多功能操控

美國物理學家阿瑟·阿什金因光鑷操控技術(shù)獲得2018年獲諾貝爾物理學獎，讓研究人員在微觀世界中也可“抓得著”物體。這一研究為物理、生物和材...

01-21

“太空醫(yī)院”離我們還遠嗎

從“神一”到“神十九”，25年間，中國航天帶給世界無數(shù)次驚喜，人們對航天員在軌期間的工作、生活情況等也越來越關(guān)注。未來，隨著我國載人航天工程、載人...

01-21

1月14日：2025年除夕火車票正式開售

　　1月14日，2025年除夕火車票正式開售?！　?025年春節(jié)從1月28日(除夕)開始，至2月4日(正月初七)...

01-21

金鐲子半年賺了6000元上海金市“貼金調(diào)換”成新風尚

　　蛇年春節(jié)過后，黃金市場表現(xiàn)強勁，金價不斷創(chuàng)下歷史新高，引發(fā)消費者的廣泛關(guān)注?！　　敖裉煳衣?..

02-08

以色列釋放90名巴勒斯坦被扣押人員

　　新華社快訊：以色列監(jiān)獄管理局20日說，已釋放90名巴勒斯坦被扣押人員。 ...

01-21

黃仁勛抵達上海現(xiàn)身陸家嘴！一周行程將滿留下諸多懸念

英偉達創(chuàng)始人CEO黃仁勛此次訪華行程進入最后一站——上海。1月21日中午，黃仁勛出現(xiàn)在上海陸家嘴一家中餐廳出席午宴。據(jù)餐廳方面向第一財經(jīng)記者透露，午宴一共八桌，為團隊聚餐。...

01-22

特斯拉Model Y煥新版價格公布售26.35萬起起售價上調(diào)1.36萬元

[本站新車上市] 1月10日，特斯拉Model Y煥新版價格公布，共推出2款配置，售價分別為26.35萬和30.35萬。煥新Model Y首發(fā)版不僅擁有首發(fā)版標識，包括尾門徽章、迎賓燈徽章投...

01-21

消息稱鴻蒙智行尊界啟動銷售專項招聘，已有數(shù)十家門店獲首批授權(quán)

1 月 21 日消息，據(jù)晚點 Auto 報道，華為與江淮汽車合作的高端品牌尊界首款車型 S800 在銷售渠道布局方面取得新進展。據(jù)悉，尊界門店銷售專項招聘已于 1 月中旬啟動，尊界 ...

01-22

難哄導(dǎo)演和偷偷藏不住是一個導(dǎo)演嗎

　　1、《難哄》導(dǎo)演和《偷偷藏不住》不是同一個導(dǎo)演，《難哄》導(dǎo)演是瞿友寧，《偷偷藏不住》的導(dǎo)演是李青蓉?！　?、這兩部作品雖然都出自同一個作者，也都是在優(yōu)酷全網(wǎng)獨播的，...

02-22

老手藝讓“哪吒”在指尖綻放

　　記者師悅　　《哪吒之魔童鬧?！窡岫裙?jié)節(jié)攀升，相關(guān)電影周邊也賣斷了貨，可謂一“吒”難求。非...

02-22

我國發(fā)現(xiàn)一起猴痘病毒Ib亞分支聚集性疫情，傳染源為1位外籍人員

　　近日，我國發(fā)現(xiàn)一起猴痘病毒Ⅰb亞分支聚集性疫情，傳染源為1位外籍人員，有剛果（金）旅居史。發(fā)現(xiàn)疫情后，國家及浙江、廣東、北京、天津等省（市）迅速啟動聯(lián)防聯(lián)控機制，開展流調(diào)...

01-21

醫(yī)健IPO解碼｜維昇藥業(yè)即將登陸港交所：“生長發(fā)育第一股”能否走穩(wěn)商業(yè)化路徑？

21世紀經(jīng)濟報道記者季媛媛上海報道近期，安科生物發(fā)布重要公告，宣布將運用自有資金，最高不超過3100萬美元（含相關(guān)手續(xù)費如經(jīng)紀傭金及征費等）...

02-14

山東商業(yè)職業(yè)技術(shù)學院云計算技術(shù)與應(yīng)用產(chǎn)業(yè)學院獲評“優(yōu)選級ICT學院”

　　大眾網(wǎng)記者司心鵬通訊員報道　　10月15日，山東商業(yè)職業(yè)技術(shù)學院云計算技術(shù)與應(yīng)用產(chǎn)業(yè)學院在現(xiàn)代服務(wù)業(yè)大樓一樓報告廳舉行第九屆華為ICT大賽宣講會。會上華為山東...

01-21

福州大學最新研究助力精準撲救野火

隨著全球變暖，野火發(fā)生的頻率和強度顯著增加，近日發(fā)生在美國洛杉磯的大火引起...

01-22

去年前三季度內(nèi)地訪客赴港投保新增保費同比微降

　　本報記者冷翠華　　見習記者楊笑寒　　香港保險業(yè)監(jiān)管局（以下簡稱“香港保監(jiān)局”）近日公布...

01-21

新“萬億銀行”接連涌現(xiàn)，江西農(nóng)商聯(lián)合銀行獲批籌建總資產(chǎn)超1.3萬億

　　進入2025年以來，省聯(lián)社改革駛向“快車道”?！　?月20日，國家金融監(jiān)督管理總局披露的批復(fù)顯示...

01-23

雙子男只是玩玩的表現(xiàn)，女生要擦亮眼睛

在愛情的世界里，有時候我們會遇到一些花心的男人。其中，雙子座的男生就以善變、多情而著...

01-22

如何激起天蝎男的心疼，讓天蝎男愛上你的絕招

天蝎座的男生通常都很深沉、神秘而又充滿魅力。如果你想讓一個天蝎男愛上你并對你心疼...

01-22

日系穿搭特點？

日系穿搭特點？一、日系穿搭的特點在穿搭方面日系風簡直把休閑做到了極致，要說亞洲潮流文化發(fā)祥地，原宿絕對是一大圣地這里除了有常見的時尚大牌，還有親民的牌子，日系穿搭的主要特...

02-07

探秘莆田珠寶產(chǎn)業(yè)園：璀璨背后的故事與機遇

探秘莆田珠寶產(chǎn)業(yè)園：璀璨背后的故事與機遇在中國東南沿海的莆田，有一個閃耀著珠寶光澤的地方，那就是莆田珠寶產(chǎn)業(yè)園。走進這個行業(yè)前景光明的園區(qū)，不僅能感受到璀璨的珠寶魅力，還...

02-07

張一鳴和王興干上了

這兩位來自福建龍巖的老鄉(xiāng)，故事就此拉開序幕。1.抖音生活服務(wù)春節(jié)團購訂單量暴漲春節(jié)放假期間，本地消費需求暴漲，讓抖音狠狠地吃了一波紅利。日前，抖音生活服務(wù)發(fā)布《2025春節(jié)消...

02-07

豬八戒網(wǎng)旗下江西八戒創(chuàng)新資源公司獲批高新技術(shù)企業(yè)

2月17日消息，豬八戒網(wǎng)旗下江西八戒創(chuàng)新資源近日收到了“高新技術(shù)企業(yè)”證書紙質(zhì)件，標志著該公司再次獲批高新技術(shù)企業(yè)。圖源：豬八戒網(wǎng)頭條公眾號江西八戒創(chuàng)新資源是豬八戒網(wǎng)企...

02-18

眾信旅游：春節(jié)后錯峰游咨詢度提升30%

2月18日消息，從眾信旅游集團了解到，節(jié)后錯峰游市場展現(xiàn)新活力。由于2025年春節(jié)假期較早，因此春節(jié)過后至3月中旬形成了小的價格低谷。從眾信旅游呼叫中心數(shù)據(jù)顯示，近期錯峰游咨詢...

02-19

58同城：春節(jié)后首周企業(yè)招聘需求環(huán)比節(jié)前增長219%

2月19日消息，58同城發(fā)布返工就業(yè)大數(shù)據(jù)，春節(jié)后首周招聘市場強勢回暖，2025年春節(jié)后首周（2月5日-12日），企業(yè)招聘需求環(huán)比節(jié)前（1月21日-27日）增長219%，求職需求較節(jié)前表現(xiàn)出倍數(shù)增長趨勢...

02-20

EBC平臺第二屆百萬美金交易大賽：攜手好友，以連接釋放熱愛

全球性金融券商集團英國EBC Group平臺始終致力于以領(lǐng)先生態(tài)，與全球交易者共塑交易的未來。自第一屆交易大賽起，為赤忱的熱愛和卓越的才華提供舞臺，在全球內(nèi)尋找交易好手以賦能...

01-24

北大博雅完成A輪融資1500萬

北大博雅（新疆）教育科技有限公司（以下簡稱“北大博雅”）在2025年2月6日宣布，已完成1500萬人民幣的A輪融資，投資方為深圳市天皓實業(yè)投資控股有限公司。此...

02-07

萬代為《深淵傳說》注冊新商標或?qū)⑼瞥鰪?fù)刻版

近日，萬代南夢宮為《深淵傳說》注冊了新商標，申請日期2025年為1月16日，公開日期為2025年1月24日。此前，在《傳說》系列30周年紀念期間，萬代南夢宮曾表示過除了《圣...

01-28

像素風3D休閑涂色游戲《彩色立方體》現(xiàn)已在Steam平臺推出試玩Demo

由AlterEyes打造的像素風3D休閑涂色游戲《彩色立方體（Color-A-Cube）》，現(xiàn)已在Steam平臺推出試玩Demo。本作中玩家將有著身臨其境的著色體驗，讓您可以探索體素世...

02-05

中方歡迎文方?jīng)Q定給予持普通護照的中國公民14天免簽入境政策

2月6日，中文雙方發(fā)表《中華人民共和國和文萊達魯薩蘭國關(guān)于深化戰(zhàn)略合作伙伴關(guān)系、推進中文命運共同體建設(shè)的聯(lián)合聲明》?！堵暶鳌分刑岬?，文方感謝中方對持普通護照的文萊公民...

02-06

上海地鐵浦江線今晨因設(shè)備故障部分區(qū)段停運，已逐步恢復(fù)正常

@上海地鐵shmetro截圖2月8日7時13分，@上海地鐵shmetro發(fā)布運營信息：目前，浦江線因線路設(shè)備故障，三魯公路至沈杜公路區(qū)段停止運營，匯臻路至三魯公路單一交路運行。目前，故障區(qū)段已...

02-08

日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

全部導(dǎo)航

“換個角度”往往是顛覆性創(chuàng)新的起點

對話《三國志?戰(zhàn)略版》發(fā)行制作人曾令鵬：敬畏三國文化，五年長跑從未躺平

榮耀換帥！趙明離職，前華為悍將接棒

今日視點丨2025年這些創(chuàng)新技術(shù)有望大放異彩

“電池數(shù)字大腦”助電站安全穩(wěn)定運行

對話芯和半導(dǎo)體創(chuàng)始人代文亮：啃骨頭、敲釘子，建生態(tài)，“芯片之母”如何以百億規(guī)模撬動千億產(chǎn)業(yè)

β-胡蘿卜素遏制口腔癌的作用機制揭示

未來10年“紫領(lǐng)”人才需求或超3100萬人

2.71億元！國美電器三日新增16條被執(zhí)行人信息，昔日家電零售巨頭資產(chǎn)負債率超148%，仍在自救