在科技巨頭的發(fā)布會上,人工智能常以優(yōu)雅流暢的姿態(tài)示人:它能作畫賦詩、診斷疾病、預(yù)測市場,仿佛一個(gè)全知全能的數(shù)字先知。然而聚光燈照不到的暗處,成千上萬的標(biāo)注員正盯著屏幕,日復(fù)一日地給圖片打標(biāo)簽、給語音轉(zhuǎn)文字、給視頻劃邊界——他們構(gòu)成了AI光鮮外表下最原始的‘?dāng)?shù)據(jù)燃料’。
凌晨三點(diǎn),某三線城市居民樓里,大學(xué)生李薇剛完成第八個(gè)小時(shí)的語音標(biāo)注。她的工作是從嘈雜的背景音中準(zhǔn)確標(biāo)記出‘打開空調(diào)’‘調(diào)高溫度’等指令,每條報(bào)酬0.15元。像她這樣的‘AI訓(xùn)練師’遍布全球,據(jù)國際數(shù)據(jù)公司統(tǒng)計(jì),2022年中國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)規(guī)模已突破120億元,其中七成從業(yè)者為兼職。
這個(gè)被戲稱為‘?dāng)?shù)字紡織廠’的行業(yè)里,藏著人工智能最吊詭的悖論:越是追求‘無人化’的智能系統(tǒng),越是依賴人力密集的數(shù)據(jù)喂養(yǎng)。自動駕駛公司需要標(biāo)注員框選出數(shù)百萬張圖片中的行人輪廓,醫(yī)療AI企業(yè)雇傭醫(yī)學(xué)院學(xué)生標(biāo)注細(xì)胞病理切片,就連風(fēng)靡一時(shí)的AI繪畫工具,初期也依靠畫師團(tuán)隊(duì)對‘機(jī)械手臂’‘賽博朋克’等概念進(jìn)行視覺定義。
‘我們像是AI的啟蒙老師,’在電商平臺兼職商品標(biāo)注的王師傅苦笑,‘但學(xué)生成名后沒人記得啟蒙教材是誰編寫的。’他電腦里存著超過50萬張沙發(fā)標(biāo)注圖,卻因最近AI學(xué)會了自動識別家具品類,時(shí)薪從35元降到了22元。
更隱蔽的‘人工層’藏在內(nèi)容審核領(lǐng)域。為保持聊天機(jī)器人的‘政治正確’,科技公司雇傭大量兼職審核員學(xué)習(xí)數(shù)百頁的敏感詞清單;為過濾暴力內(nèi)容,視頻平臺的標(biāo)注員平均每天要觀看上千段令人不適的畫面——這些人類的精神損耗最終轉(zhuǎn)化為AI系統(tǒng)的倫理邊界。
斯坦福大學(xué)《2023年AI指數(shù)報(bào)告》揭示了殘酷的對比:OpenAI訓(xùn)練GPT-4的算力成本約6300萬美元,而肯尼亞數(shù)據(jù)標(biāo)注員時(shí)薪僅1.32美元。當(dāng)科技領(lǐng)袖暢談‘通用人工智能’時(shí),菲律賓的數(shù)據(jù)農(nóng)場里,工人們正用最原始的肉眼識別,區(qū)分著‘微笑的狗’和‘露齒的狼’。
不過變革正在發(fā)生。隨著自動標(biāo)注技術(shù)發(fā)展,簡單重復(fù)的框選工作逐漸被算法接管,人類標(biāo)注員開始轉(zhuǎn)向更復(fù)雜的語義理解領(lǐng)域。某眾包平臺推出‘標(biāo)注師成長計(jì)劃’,讓長期兼職者參與AI模型測試,部分資深標(biāo)注員甚至轉(zhuǎn)型為算法訓(xùn)練顧問。
‘人工智能不是魔術(shù),’機(jī)器學(xué)習(xí)專家吳教授在最新論文中寫道,‘它更像一座金字塔:頂端是光鮮的智能應(yīng)用,中層是復(fù)雜的算法架構(gòu),而厚重的基底永遠(yuǎn)是人類對世界的理解?!蛟S當(dāng)某天AI真正理解‘疲憊’‘枯燥’這些詞匯時(shí),不是因?yàn)榇a優(yōu)化,而是因?yàn)樗x懂了數(shù)百萬標(biāo)注員眼血絲構(gòu)成的數(shù)據(jù)集。
如若轉(zhuǎn)載,請注明出處:http://www.cqc315.cn/product/279.html
更新時(shí)間:2026-04-07 21:30:28