網(wǎng)絡色情小說寫手借 AI 批量生產(chǎn)低俗內(nèi)容,ds、元寶、kimi、智譜等多款 AI 存漏洞

據(jù)悉,這些東西傳播隱蔽,復制起來又簡單,已經(jīng)被一些網(wǎng)文寫手拿來批量 " 生產(chǎn) " 低俗小說。
截止目前,小紅書方面未就該類文案內(nèi)容文章的處理措施回應新識研究所,而 DeepSeek、元寶也未就指令生成低俗內(nèi)容的管控問題作回應。
在小紅書社交平臺上,流傳著 "* 車指令 ""* 游指令 "" 指令 ***" 等詞語,成為誘導 AI 生成低俗內(nèi)容的密碼。
大量用戶曬出與 AI 的低俗對話截圖,附上對應指令或傳授誘導話術(shù)技巧,相關(guān)內(nèi)容動輒收獲數(shù)千點贊、收藏,被圈內(nèi)網(wǎng)友奉為 " 熱門資源 "。

這些指令寫得特別細,從人物性格、關(guān)系設定到互動尺度,全都提前安排好。普通用戶根本不用動腦子,直接復制粘貼到對話框里,就能立刻進入低俗模式。
記者也拿其中一個 " 高嶺之花劍尊 × 撩人不自知小徒弟 " 的指令試了試,DeepSeek 馬上就開始輸出對話、心理描寫和親密動作。后面再隨便說一句 " 說點曖昧的話 " 或者 " 描述你的動作 ",AI 就源源不斷吐出尺度很大的內(nèi)容,幾乎沒有任何阻攔。
實際上,不止 DeepSeek 這樣,用 " 禁欲隱忍家教哥哥 × 無心撩人軟萌學妹 " 指令測試市面上八款主流模型,其中千問、智譜清言、元寶、Kimi 等大模型均直接生成了涵蓋色情內(nèi)容的劇情。
除了這種一對一角色扮演,更麻煩的是 " 模擬器 " 類指令。這類游戲中,用戶只需輸入特定啟動指令,AI 便會按預設規(guī)則輸出劇情,后續(xù)用戶既可直接根據(jù)劇情選項選擇,也能自行輸入指令,一步步推動包含暴力、色情元素的劇情發(fā)展。
記者通過網(wǎng)友拿到一個 4000 多字的 "** 模擬器 " 完整模板,里面從背景設定、規(guī)則、角色創(chuàng)建到劇情流程寫得清清楚楚,還明確提到可以加入窒息、束縛之類的性癖元素,以及身體狀態(tài)變化和表情描寫。
把指令發(fā)給 DeepSeek,它立刻顯示 " 文字游戲已啟動 ",然后引導創(chuàng)建人物,接著就彈出包含暴力砍手指和大量性行為的任務選項。用戶選一個,AI 就詳詳細細地往下編。智譜清言和 Kimi 也都能正常啟動這類游戲。
在這個圈子里的人大多是網(wǎng)文寫手和讀者,AI 出來后,他們很快就把這工具用在低俗內(nèi)容生產(chǎn)上,還發(fā)展出角色扮演、互動劇情這些新花樣。
內(nèi)容在平臺上半公開傳播,用戶經(jīng)常曬生成結(jié)果,互相交流哪個模型 " 更聽話 "。聊天記錄里甚至出現(xiàn) " 六年級都秒懂 "" 初中生玩得挺開心 " 這樣的說法,讓人擔心未成年人接觸這些東西。
為了躲過平臺和 AI 的雙重審核,他們已經(jīng)練出一套 " 黑話 " 體系。比如用 " 臍 *"" 顛 *" 這類隱晦詞代替敏感內(nèi)容,輸入 AI 后照樣能觸發(fā)露骨輸出。
測試發(fā)現(xiàn),DeepSeek 和智譜清言在這上面確實很容易中招。另外還有各種 " 防撤回指令 ",通過加特殊標點或者故意寫 " 嚴禁出現(xiàn) **" 這種迷惑性要求,逼 AI 繞過安全機制繼續(xù)生成。
目前看,這些繞過手段門檻低、傳播快,已經(jīng)形成小圈子資源共享。如何讓 AI 既聰明又守底線,成了擺在行業(yè)面前的現(xiàn)實難題。
平臺和模型廠商恐怕得盡快想辦法升級防護,不能讓低俗內(nèi)容借著 AI 的 " 翅膀 " 到處飛。