色播视频在线观看,国产精品视频无圣光一区,中文字幕一区日韩精品欧美

近年來，人工智能（AI）技術推動生產力快速發展，但同時也因技術濫用導致各種問題。

為監督AI技術使用，如今市面上不乏各類用于檢測AI生成內容（AIGC）的工具，如普林斯頓大學學生開發的GPTZero、斯坦福大學研究團隊推出的DetectGPT等。我國一些研究團隊也陸續發布各類檢測工具，如西湖大學文本智能實驗室研發的Fast-DetectGPT。

人類的創作與AIGC之間存在哪些差異？AI檢測工具如何根據差異進行識別？AI檢測工具如何應對越來越聰明的大模型？帶著這些問題，記者采訪了有關專家。

AI創作套路化明顯

“雖然大模型在不斷發展迭代，但到目前為止，AIGC與人類的創作在用詞用語、邏輯語法等方面依舊存在明顯區別。”Fast-DetectGPT研發者之一、西湖大學文本智能實驗室博士生鮑光勝說。

在用詞用語上，AIGC有相對固定的偏好。“不難發現，一些詞語會反復在語段中出現。”鮑光勝舉例說，有研究發現，大模型應用于英語學術論文寫作時，“delve”（深入研究）一詞的使用頻率大大提高，這是因為大模型習慣用這個詞對語句進行潤色修改。

在邏輯語法上，AIGC慣常使用的一些語法搭配方式，在人類創作中可能并不常見。“受模型建模的影響，AIGC有相對固定的行文邏輯和表述模式，且這些模式會不斷地被重復。人類在行文上則更為靈活，沒有固定套路。”鮑光勝說。

北京大學信息管理系師生比較了AI生成與學者撰寫的中文論文摘要。研究結果同樣顯示，AI生成的摘要具有較高同質性和較強寫作邏輯性，并慣用歸納總結等學術話語體系；學者撰寫的摘要則具有顯著個性化差異，使用凸顯實際含義的搭配較多，并常用與國家政策密切相關的詞語。

哈爾濱工業大學一名研究生向記者講述了他使用大模型的實際感受：“當我給大模型提供一些材料讓它擴寫，它每次都用相同的套路——把給定的材料拆解開，分為若干點論述?？傮w來說感覺它寫得比較“僵”。”

AIGC相對套路化的創作，可能會影響人類的用語習慣。“隨著越來越多人用AI創作或潤色文字，人類會受到潛移默化的影響，這或將影響整個社會對語言的使用。”鮑光勝說。

三種路徑識別文本

如何準確識別AI生成內容？鮑光勝介紹，目前主要有三種技術路徑進行檢測，分別是模型訓練分類器法（也被稱為監督分類器法）、零樣本分類器法、文本水印法。“三種檢測方法本質上都是利用AI檢測AI，且各有優劣。”鮑光勝說。

模型訓練分類器法，首先要收集大量人類創作內容與AIGC，然后以此為基礎訓練一個能區分兩類內容的分類器。“這是目前被廣泛使用的一種方法，但缺點較為明顯。”鮑光勝解釋，用于訓練分類器的數據有限，很難覆蓋所有類型和語言的文本。分類器在訓練數據覆蓋的文本領域或語言上檢測準確率較高，反之準確率則較低。而且，模型訓練往往需要較高成本，數據規模越大，訓練成本越高。

相比之下，零樣本分類器法不需要對機器進行訓練，也無需收集數據。它利用已訓練好的大模型，抽取語言模型生成文本的特征，據此來區別人類與機器。“似然函數是零樣本檢測法中比較常用的基準之一，它可以簡單理解為一段文本在某個模型的建模分布中出現的概率。概率是一種特征，不同的概率體現了人類創作內容與AIGC的差異。”鮑光勝進一步解釋，“零樣本分類通過綜合考慮多種函數特征來區分人類創作內容與AIGC。”

如今，很多大語言模型幾乎覆蓋了互聯網上的全部數據。因此，相比于模型訓練分類器，零樣本分類器在不同領域、不同語言的文本上表現較為一致。

不過，零樣本分類器也存在明顯缺點。一方面，現有零樣本分類器依賴生成文本的源語言模型進行檢測，這意味著如果是未知源模型生成的文本，分類器就無法準確檢測。另一方面，為提高檢測準確率，零樣本分類器往往需要多次調用模型，這增加了模型的使用成本和計算時間。

“文本水印法則是一類“主動方法”。區別于前兩類方法，它不是檢測已生成的文本，而是在AI生成文本時加入水印。人類雖然看不出這些水印，但卻能通過技術手段檢測出來。”鮑光勝說，文本水印法的準確率較高，但缺點在于水印可能被人為弱化甚至移除。此外，對于無法訪問模型內部結構的大語言模型，技術人員可能無法在生成內容時成功加入水印。

檢測技術需不斷改進

“未來，我們要不斷更新、完善現有技術，力爭實現快速、準確、低成本檢測，在大模型這把“矛”越來越鋒利的同時，讓檢測技術這面“盾”更為堅固。”鮑光勝說。

記者了解到，為提升檢測準確性，目前市面上的商用AI檢測軟件大多融合了多種技術手段。國內外研究團隊也在進一步完善相關技術。

例如，西湖大學文本智能實驗室團隊在DetectGPT基礎上研發的Fast-DetectGPT模型，可提升AI檢測準確性，縮短檢測時間。“Fast-DetectGPT與其他零樣本分類器原理一致。其中一個創新點在于，我們提出通過條件概率曲率指標進行檢測。”鮑光勝說，“與DetectGPT相比，Fast-DetectGPT在速度上提升340倍，在檢測準確率上相對提升約75%。”

對AI檢測AI的前景，有兩種截然不同的觀點。一種觀點認為，未來AIGC將會與人類創作極為相似，以至于檢測工具無法判別。還有一種觀點認為，隨著技術發展，檢測技術或將趕超大模型技術，實現對AIGC的有效識別。

“目前，無論是AI生成的文字、圖片還是視頻，都在技術可識別的范疇之內。相較于文字，圖片和視頻甚至可以直接被專業人士肉眼識別。期待未來通過大模型技術的不斷進步，推動檢測技術發展。”鮑光勝說。

AI檢測AI：“矛”更利還是“盾”更堅

汽車生活更多>>