朱自清的《荷塘月色》,AI疑似生成率超60% ?專家回應
還記得朱自清的《荷塘月色》嗎?“曲曲折折的荷塘上面,彌望的是田田的葉子。葉子出水很高,像亭亭的舞女的裙……”
5月22日,這篇全文1361字的經(jīng)典散文,沖上熱搜,起因是有網(wǎng)友發(fā)現(xiàn),它被某AI檢測工具判定:AI疑似生成率超過60%。
評論區(qū)頓時炸開了鍋。有網(wǎng)友調(diào)侃,“那我的論文AI率80%,是不是也正常了?”也有網(wǎng)友懷疑,AI率是隨機生成的;還有網(wǎng)友爆料,同一篇文章,不同平臺查出的AI率相差30%。
這到底是怎么一回事?AI率檢測工具究竟靠不靠譜?記者跟西湖大學文本智能實驗室博士、Fast-DetectGPT研發(fā)者之一鮑光勝聊了聊。
他的第一個回答,就有點出乎意料。
“大家對AI率有誤解”
關(guān)于AI率,鮑光勝認為,大家首先可能存在一個誤解?!氨热缫黄恼聶z測出AI率60%,并不是說每100個字里面,就有60個字是AI寫的。AI率實際上是指一篇文章有多大概率由AI生成,60%就意味著它有60%的概率由AI整體生成。”
檢測工具其實無法分辨,也不能告訴你哪幾個字出自AI之手?!耙驗橐粌蓚€字的微觀層面,人類和AI的差別幾乎看不出來。”
那它是怎么來判斷的?簡單說,就是在宏觀層面尋找統(tǒng)計上的線索。例如在用詞方面,AI會有相對固定的偏好,某個冷門詞出現(xiàn)的頻率如果遠高于人類平均水平,就會成為一個統(tǒng)計的信號。
鮑光勝舉了個例子:有研究發(fā)現(xiàn),大模型應用于英語學術(shù)論文寫作時,單詞delve(深入研究)的使用頻率大幅提高,“這時,就可以拿它作為一個信號或者說特征”。
但這種特征是統(tǒng)計意義上的,“它需要在一篇文章中反復出現(xiàn)某些可被檢測的信號。因此,如果只給出一段很短的文字,是無法準確判斷是否為AI所寫。”鮑光勝認為,目前的檢測工具對于100字以下“小作文”的判斷通常不太準確,到了500字左右,結(jié)果就比較可信了。
《荷塘月色》是怎么被誤傷的
那么,《荷塘月色》超60%的AI率是怎么回事?
“以現(xiàn)在的檢測技術(shù),如果是全新寫的文章,AI率可能更準些,老文章反而不一定。”鮑光勝先給了一個結(jié)論。
原因很簡單,就是那些膾炙人口的經(jīng)典文本,絕大部分早就被用來訓練大模型。
“AI檢測的基本原理是這樣的,你的一篇文章放到大模型,看它的用詞、詞頻分布等,和模型預測的分布是否一致。”通常情況下,如果是AI生成的文字,那它和模型的預測會比較一致。
于是,問題就來了:當AI檢測工具遇到在學習階段就“讀”過的經(jīng)典文本,這種“一致性”就會因為模型熟悉這些表達而變得很高,進而傾向于判斷文章是AI寫的。
《荷塘月色》大概率就是這樣被誤傷了。
AI模仿的是整個人類的寫作共性
在評論區(qū)的熱門位,有網(wǎng)友反映自己的同一篇文章,不同平臺查出的AI率相差30%。鮑光勝說:這太正常了。
“市面上各個檢測工具用的算法不一樣,有的主要看詞頻,有的側(cè)重語法,有的看語義。單獨一篇文章,差30%一點都不奇怪。”
今天的熱搜里,還提到了一個現(xiàn)象:有些平臺一邊賣AI生成論文,一邊又提供降A(chǔ)I率服務(wù)。
“這就是互相攻防?!滨U光勝繼續(xù)解釋。
降A(chǔ)I率的原理,說起來并不神秘:研究市面上的檢測工具喜歡抓什么信號或者說特征,比如某個詞用得太頻繁,那就把它換成另一個意思相近的詞。“更換后意思不變,但檢測工具就抓不到了?!?/p>
他同時也提到,對抗檢測最好的方式或許是保持自己的寫作風格。
“AI是在模仿整個人類的寫作共性。如果你有非常獨特的個人風格,AI反而不太容易抓住?!边@就是為什么有些人的文章AI率很高,而另一些人卻沒事,后者可能天生就不按套路寫。
AI檢測AI,未來是持續(xù)的攻防戰(zhàn)
鮑光勝博士研究的方向是AI生成文本檢測,他從2022年底ChatGPT問世后就開始關(guān)注這一問題。
“當時覺得隨著AI應用的普及,它會變得越來越嚴重。互聯(lián)網(wǎng)上AI生成內(nèi)容越來越多,會侵蝕人與人之間的信任,比如教育場景中的師生關(guān)系。另外,AI生成的東西,人類單靠自己會越來越難分辨,需要‘AI檢測AI’”。
他所在的西湖大學文本智能實驗室研發(fā)了Fast-DetectGPT,這是一個可以快速并準確檢測文本是否由AI生成的工具,相關(guān)成果發(fā)表在國際會議ICLR 2024上。
鮑光勝坦言,未來會是持續(xù)的攻防戰(zhàn),大模型越來越強,AI檢測技術(shù)跟著升級,然后新的模型又來了……
“網(wǎng)上不少人可能覺得檢測工具說這篇文章是AI寫的,那就一定是。但任何AI檢測工具給的都只是概率,這個概率有一定可能是錯的。”他強調(diào)說,這個觀念,才是最需要傳遞給大家的。
至于有學生網(wǎng)友在網(wǎng)上“喊冤”,說自己手搓的論文被判了高百分比的AI率,鮑光勝給出了三種可能:要么不是完全自己寫的,要么不自覺受了AI模板影響,要么就是檢測工具本身不準?!霸絹碓蕉嗳嗽趯懽髦杏肁I給的模板做參考或直接潤色文字,AI已經(jīng)在影響人類的用語習慣。”
- 以AI賦能生物醫(yī)藥研發(fā)? 中國電信發(fā)布多項創(chuàng)新成果
- 錨定AI時代能源需求新趨勢 道通科技在悉尼發(fā)布電網(wǎng)協(xié)同與車隊充電方案
- 年內(nèi)三換董事長、醫(yī)藥跨界AI遭質(zhì)疑,*ST賽隆身陷退市危局
- 美團發(fā)布AI瀏覽器Tabbit 1.0
- 蘋果推出Siri AI!庫克“最后一舞”,市場反應平淡
- 2026清潔機器人品牌推薦|AI導航避障實測:掃拖自清潔場景性能榜
- 趙崇:讓 AI 真正走進企業(yè)經(jīng)營,成為創(chuàng)業(yè)者的增長系統(tǒng)
- AI老“霸總”相親瞄準中老年,1.2萬條留言里,老人竟寫下個人詳細信息
- AI底層技術(shù)推動泳池機器人邁入智能時代
- 搜狐創(chuàng)始人張朝陽:AI不會讓人沒事做,因為“人類有很多新的需求”















