蛇年春節的“頂流”是誰?DeepSeek當之無愧。
事實上,過去一年多,不僅僅DeepSeek,還有ChatGPT、文心一言、豆包、Kimi……各路網友腦洞大開,挖掘出 DeepSeek 千奇百怪的用法,搞翻譯寫總結,提供創業、理財、育兒、旅行等各種高能方案,甚至還得整點玄學……
只是,此時再刷手機,你還能分得清,哪段是DeepSeek寫的,哪段是人寫的嗎?
比如下面這段話,是誰寫的呢?在晨光的輕撫下,城市的輪廓逐漸清晰,街道上行人稀少,只有偶爾的晨跑者打破了這份寧靜。空氣中彌漫著新鮮面包的香氣,從街角的面包店飄散開來,誘惑著過往的行人。公園里,老人們打著太極,動作緩慢而流暢,仿佛與這個世界和諧共鳴。孩子們的笑聲從遠處的游樂場傳來,清脆悅耳,如同天籟之音。這座城市,就像一幅精致的畫卷,每一筆每一劃都透露著生活的韻味和時代的痕跡。在這里,每一個瞬間都值得被珍藏,每一段故事都值得被講述。
“真假美猴王”
很難選很難評?
如果你在兩種答案之間猶豫不決,不妨求助一下Fast-DetectGPT。
這是由西湖大學自然語言處理實驗室研發的一款AI程序,一段文本到底是不是AI生成的,逃不過它的“眼睛”。
我們把這道選擇題交給它試試。
首先,打開Fast-DetectGPT,主界面一目了然。
我們上面那段文字復制粘貼在左側的對話框里,隨著點擊“summit”提交,右側的判定結果很快就出來了——是AI(DeepSeek)寫的!
它對這個判定有幾成把握?
據右邊藍色的環形進度條提示,它認為AI生成的概率高達84%。
恭喜Fast-DetectGPT,回答正確!
不得不感嘆,從生成到檢測,AI自己就實現了“閉環”。人類,甚至是人類中的“專家”也完全比不過。
2023年12月,發表在Research Methods in Applied Linguistics上的一則研究,討論了頂級期刊的語言學家/評論家能夠在多大程度上區分AI寫作和人工寫作——72位語言學專家參與了這項調研,結果這些專家的正確率不足40%。
“真假美猴王”的經典橋段,正在人工智能領域上演。
“找不同”
盡管我們作為“人”,很難準確揪出AI生成的文字,但面對“不是人”寫的文字時,總有一種說不上來的“別扭”。這種別扭,或許是來自潛意識里的直覺判斷,但這種別扭說不清道不明。
事實上,機器生成的文本與人類生成的文本看起來很像,但在語義、語法、用詞習慣等細節處理上存在許多“不同”。
Fast-DetectGPT這款AI工具,本質上就是“找不同”。
“人類的思考是‘因果性’的,而機器的思考則偏向‘統計性’。”什么意思?西湖大學自然語言處理實驗室負責人張岳進一步解釋,“以寫文章為例,AI的寫法是學習現有的數據,從中挑選最‘安全’的詞,也就是按照概率高低來選詞,這和人寫作的創造性是有本質區別的。”
如果現在有一個數據庫,里面裝著人類歷史上100位天才作家的文章。當AI用“統計性”去學習這個數據庫,它學到的不是這些天才作家的“神來之筆”,而是他們之間共用的、出現頻率更高的詞。
這個詞,叫“平庸”。
還是很難理解?
那我們來看一段“人”寫的文字:
我翻開歷史一查,這歷史沒有年代,歪歪斜斜的每頁上都寫著‘仁義道德’幾個字。我橫豎睡不著,仔細看了半夜,才從字縫里看出字來,滿本都寫著兩個字是‘吃人’!
什么樣的歷史沒有年代?字縫里怎么能看出“吃人”的字來?看似“毫無邏輯”的話語,實則寫出了封建禮教的殘酷本質。你應該也看出來了,這段出自魯迅的《狂人日記》。
如今,AI或許可以模仿魯迅的文風,但要原創出這種哪哪都是“危險”用詞的文筆,對AI來說是絕無可能的。
為什么?因為AI缺少“泛化性”。
也就是模型在訓練數據集中學到的能力,能不能通過背后的因果邏輯“舉一反三”,把這種能力應用到全新的領域,獲得“分布以外的泛化性”。
張岳深耕自然語言處理(NLP)領域多年。從清華的本科、牛津的博士、劍橋的博后,到新加坡科技與設計大學和西湖大學的獨立科研,他始終將研究聚焦在AI的泛化性上,即如何讓機器真正像人一樣思考——
有直覺,也有理性;能憑空創造,也能邏輯推理。
“在大模型看來,每個人都是‘危險’的。”張岳說。
以子之矛,攻子之盾
回到Fast-DetectGPT,我們已經知道AI生成內容和人類生成內容的本質不同,如何利用這種不同開發工具呢?
目前已知主要有三類技術來識別AI生成的內容:監督分類器法、零樣本分類器法、文本水印法,用起來各有利弊。
監督分類器法比較實在,它需要收集大量的已知數據去做分類學習,就像學生上課,碰到沒有“見過”“學過”的數據,就會找不著北,導致準確率下降。
零樣本分類器法,顧名思義無需收集數據,它主要是學習AI寫的文本有什么特征,以此來做區分判斷。但是,AI寫文章到底有什么“特征”呢?如果AI寫得越來越像人,“特征”越來越不明顯怎么辦?這些都是難點。
文本水印法,與前兩種主動區分AI和人類的方法不同,它是在AI生成的文本上打上“水印”,準確率比前兩種都要高,但可能存在水印被人為弱化甚至移除的風險。
鮑光勝選擇了零樣本分類器法來完成這項實驗。他是Fast-DetectGPT的主要研發者,也是西湖大學2022級博士研究生,考進來的時候43歲,是校內年齡最長的學生。在選擇讀博之前,他分別在微軟和阿里巴巴工作多年,在自然語言處理上積累了充足的產業界實踐經驗。
他提出一種假設——在給定上下文的情況下,人類和AI在選擇詞匯時會存在明顯的差異,但是不同AI模型之間的差異并不明顯。利用這種差異,研究團隊利用一種自動化的指標去區分。
我們可以把它理解成,面對一篇文章,Fast-DetectGPT作為AI先想想如果是自己寫會怎么寫呢?然后根據這個自問自答的參考答案,去比對原文看看重合度有多高——以子之矛,攻子之盾。
鮑光勝進一步解釋,當程序接收到一個文本片段,首先會在不改變原意的情況下進行改寫,把局部的同義詞替換掉,再將這份替換后的文本與原始文本進行對比,如果是AI寫的,兩者之間的相似性會比較明顯。
簡單點說, AI對AI寫的內容更“熟悉”,可以“認出”同類的作品。
效果怎么樣?
目前,Fast-DetectGPT及其私有模型擴展Glimpse能夠支持26種語言。2024年4月上線至今,已經有5萬多人次用它做過“是AI還是人”的檢測。與上一代DetectGPT相比,Fast-DetectGPT在速度上提升了340倍,在檢測準確率上相對提升約75%。在ChatGPT生成的文本上,Fast-DetectGPT 檢測正確率為96%;在GPT-4生成的文本上,Fast-DetectGPT檢測的正確率達到了90%;針對DeepSeek-v3生成文本的檢測,正確率則達89%。而其擴展Glimpse進一步將多語言場景下的檢測錯誤率降低50%以上。
新奇與熱鬧過后,隨著AI寫得越來越像人,安全、公平、知識產權等問題隨之而來。
面對AI快速生成的大量文本、圖片、音頻、視頻,如何第一時間辨別真偽?
當AI生成和人類生成的內容同臺競爭,還有沒有公平可言?
利用AI創作的內容,版權又該如何界定?
AI 生成內容也讓我們不得不思考,人類獨特的價值究竟是什么?
這些問題,我們無法很快給出答案,但不論從任何一個問號出發,張岳認為:“檢測出哪些是AI生成的內容,是人類維護內容安全的第一步。”
但,人工智能勢不可當。
我們必將擁抱AI。內容安全之上,我們也必須相信“人”的價值。
AI科學家張岳說,創造力、批判性思維、社交能力以及領導力等等,都是AI難以復制的“人類特質”。
作家麥家說,未來的眼淚在哪里?機器不知道,偉大的作家是知道的。最好的那1%的作品,依然需要人去創造。
也許現在我們都應思考,如何去發展那1%的珍貴。
本文鏈接:http://m.020gz.com.cn/news-8-2758-0.html準確率96%!AI時代如何分辨“真假美猴王”?
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
上一篇:北京新增一所大學
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕