首頁聚·焦點財·知道銳·評論話·數(shù)據(jù) 深·觀察讀·榜樣新·資訊

深·觀察深·觀察

8元買3萬張人臉照片誰在搜集、買賣你的“臉”？

2019年11月19日 15:12 | 來源：新京報

分享到：

11月初，國內(nèi)“人臉識別第一案”引發(fā)了輿論關(guān)于人臉識別技術(shù)與安全的討論。而不久前，“ZAO”APP的興起也讓AI換臉走入了普通民眾的視野，值得注意的是，AI換臉技術(shù)目前已被應(yīng)用于影視、娛樂等各方面，甚至是淫穢視頻。這引發(fā)了社會對人臉數(shù)據(jù)是否可能被濫用的爭議。

誰在搜集你的臉？誰在買賣你的臉？

新京報記者近日調(diào)查發(fā)現(xiàn)，網(wǎng)上有一些私下售賣人臉數(shù)據(jù)的賣家，有發(fā)帖者稱8元可買3萬張人臉照片。有賣家表示可以提供“更多渠道”的人臉圖片，按照3000元可買24000套人臉照片來計算，相當(dāng)于一套只要一毛多。還有賣家表示，其出售的照片大部分來自朋友圈，且沒有取得對方同意。

北京大學(xué)法學(xué)院教授薛軍告訴新京報記者，有必要對人臉識別設(shè)置門檻，“人臉信息伴隨著人的終身，一旦發(fā)生泄露風(fēng)險就特別大，所以要進行最嚴格的保護，首先必須得到用戶明示同意才能收集，我個人認為有時得到個人同意也不行，需要國家授權(quán)才能收集敏感的生物識別信息。”

人臉照片在網(wǎng)上可公開下載

部分來自于網(wǎng)站爬取

人臉照片正在被作為商品售賣。

新京報記者在IT社區(qū)、網(wǎng)絡(luò)商城等多個平臺搜索發(fā)現(xiàn)，有不少人臉照片可供免費下載或付費購買。付費金額由帖子發(fā)布者自定，多在10元到20元左右，如有發(fā)帖者表示可以“8元購買60名志愿者的每人500張照片，共計3萬張照片”。

記者瀏覽多個人臉下載帖發(fā)現(xiàn)，人臉圖片的上傳者一般會對圖片中涉及的人臉屬性進行標(biāo)明，如“小孩”、“明星”、“網(wǎng)紅”等。照片場景則多種多樣，有個人自拍，也有與朋友的合影，而被截取下來的只有人臉部分的圖片。

據(jù)了解，在IT社區(qū)中可公開下載的照片標(biāo)記為外國研究機構(gòu)提供的國外志愿者照片，如有帖子表示“耶魯大學(xué)AR人臉數(shù)據(jù)庫、卡耐基梅隆大學(xué)PIE數(shù)據(jù)庫等打包賣15元”，這些圖片是為了訓(xùn)練人臉識別專門搭建的數(shù)據(jù)集，圖片質(zhì)量較好。

不過，也有部分照片來源于網(wǎng)站爬取。記者下載了13萬張標(biāo)記為“網(wǎng)紅”的人臉圖片后，隨機選取五張照片在百度識圖搜索后發(fā)現(xiàn)，其中一張照片為一名香港藝人。而記者搜索與該藝人名字相關(guān)的圖片后發(fā)現(xiàn)，所下載的人臉圖片的來源五花八門，有的截取自娛樂新聞網(wǎng)站的新聞圖片，也有博客發(fā)布的博文配圖。值得注意的是，有的圖片來自于已刪除的博客，但記者仍然可以在搜索引擎搜索到相關(guān)圖片，只不過源網(wǎng)頁顯示“內(nèi)容已刪除”。

對于可直接下載的圖片，有發(fā)布者表示，其提供的數(shù)據(jù)集可以任意拿來下載研究，“只要別用在商業(yè)和不正當(dāng)用途就可以了”。

對此，北京市中聞律師事務(wù)所合伙人趙虎表示，這或存侵犯肖像權(quán)與著作權(quán)的問題。“他人公開上傳到貼吧或者微博的他人的圖像，只是這些肖像權(quán)人在行使自己的肖像權(quán)，如果沒有明確授權(quán)他人使用的，任何人出于商業(yè)目的而進行使用，肯定是會侵犯他人肖像權(quán)的。除了上傳肖像，還有可能上傳一些自己拍攝的其他圖片。若未經(jīng)著作權(quán)人明確授權(quán)可以使用這些圖片外，還會涉嫌侵犯他人的著作權(quán)。”

中國人民大學(xué)法學(xué)院副教授丁曉東對此的看法則較為寬松，“我認為爬取公開的圖片本身沒有問題，比如明星的圖片，但這一行為也需要根據(jù)圖片的來源和圖片的場景來認定，如果對微博和好友相冊等半公開圖片進行爬取，由于存在生物識別信息，存在一定風(fēng)險，爬取就需要有一定的限制。”

有賣家稱人臉圖片“可定制”

3000元可購買24000套

新京報記者發(fā)現(xiàn)，由于國外進行人臉識別項目時間較早，目前公開提供的人臉數(shù)據(jù)庫的圖片多來自國外，照片也以外國人為主，但對于國內(nèi)的人臉識別研究項目，為讓模型識別更為精準，最好使用中國或亞洲面孔的圖片，此時外國數(shù)據(jù)庫的圖片往往無法滿足需求。

對此，也有網(wǎng)購平臺上的賣家提供照片“定制”。新京報記者在淘寶搜索人臉數(shù)據(jù)集后注意到，某店鋪提供“同人N張人臉數(shù)據(jù)集，超10萬人不同角度、不同場景、不同身份、無遮擋、非名人非網(wǎng)絡(luò)圖庫”的人臉數(shù)據(jù)庫，還支持“一站式”的數(shù)據(jù)定制服務(wù)。商品詳情介紹顯示，數(shù)據(jù)獲取含有人工數(shù)據(jù)采集、自動化數(shù)據(jù)采集、調(diào)研問卷收集三個途徑。

新京報記者查閱店鋪信息發(fā)現(xiàn)，購買人臉數(shù)據(jù)的定價為十元，但具體購買多少需要再與店家進行溝通。記者根據(jù)店鋪公開顯示的手機號與賣家取得了聯(lián)系。“有些人要一兩萬個，有些要十萬個。一般都是要一萬個人以上，每個人五張。”該賣家表示，“(照片)都是自己采集的。”

該名店家強調(diào)，“所有的照片都是近期的。”至于圖片來源，對方表示“大部分來自于朋友圈，有的是朋友圈一傳十十傳百收集來的，有的則是直接購買的，收集起來十分費勁。”

隨后，該店家發(fā)送給新京報記者一組儲存有人臉照片文件夾的截圖，截圖共包含有18張照片，每個照片均被以數(shù)字編號命名。“一個人一元，五張照片，在轉(zhuǎn)賬之前，可以利用遠程操作來觀看這些照片。”

值得注意的是，該店家承認，“這個(使用照片)肯定沒有取得人家的同意。”不過，在她看來，這些照片被拿來做研究并無不妥。“不是公布到社交平臺或公開網(wǎng)站，肯定是沒問題的。”

關(guān)于定制服務(wù)，該店客服向記者發(fā)送了“定制”所需維度，包括男女比例、年齡層次比例、國籍等。“有其他要求也可以說。”數(shù)據(jù)集的價格與以上因素相關(guān)。

據(jù)其介紹，最近詢問此款商品的人并不在少數(shù)，至于標(biāo)價十元只是一個基數(shù)，交易的話還需要簽訂合同，通過對公賬戶轉(zhuǎn)款。“走公賬及簽訂合同是雙方的一個保障。”

此外，新京報記者在瀏覽國外網(wǎng)站時發(fā)現(xiàn)，有不少軟件公司公開出售其儲備的人臉數(shù)據(jù)庫，如一家網(wǎng)站儲存有75萬張人臉圖片，數(shù)據(jù)共305GB。此類包含動輒數(shù)萬人臉照片的數(shù)據(jù)庫在網(wǎng)絡(luò)空間并不難查找，且有的數(shù)據(jù)庫并未對其圖片來源是否合法做出明確標(biāo)識。

新京報記者通過在IT社區(qū)人臉數(shù)據(jù)資源帖評論區(qū)加微信的方式聯(lián)系到一名自稱擁有人臉數(shù)據(jù)庫的賣家，對方表示如果支付3000元，可以提供24000套人臉圖像，渠道“多種多樣”。對于具體的人臉圖像來源，對方僅表示是“中國的”，但沒有透露更多。

趙虎告訴新京報記者，非法買賣人臉圖像等數(shù)據(jù)可能違反《民法總則》《侵權(quán)責(zé)任法》中對于他人隱私權(quán)、肖像權(quán)的保護。而國家機關(guān)或者金融、電信、交通、教育、醫(yī)療等單位的工作人員利用其掌握的公民人臉數(shù)據(jù)，然后進行倒賣的，可能會構(gòu)成《刑法》規(guī)定的出售、非法提供公民個人信息罪。“如果是手機APP等非法搜集用戶相關(guān)信息，則還會違反《移動互聯(lián)網(wǎng)應(yīng)用程序信息服務(wù)管理規(guī)定》的相關(guān)規(guī)定。”

人臉數(shù)據(jù)的信息泄露風(fēng)險

專家：從制度上約束，防止信息泄露

在安恒信息安全研究院院長吳卓群看來，人臉數(shù)據(jù)存在唯一性，如果廠商將人臉數(shù)據(jù)收集以后沒有規(guī)范化應(yīng)用，一旦泄露可能導(dǎo)致嚴重的后果。

“人臉識別本身是方便我們生活的，可以免去我們輸密碼的麻煩，但它最大的風(fēng)險在于信息泄露，因為包括人臉在內(nèi)的生物識別具有唯一性，這些唯一性的人臉信息一旦被采集上去，如果沒有妥善處理，可能會被濫用。”吳卓群告訴新京報記者。

10月28日，由于反對采用人臉識別的方式進入動物園，浙江理工大學(xué)特聘副教授郭兵作為消費者將杭州野生動物世界告上了法庭，該案也成為國內(nèi)消費者起訴商家的“人臉識別第一案”。2019年11月1日，杭州市富陽區(qū)人民法院正式受理此案。

郭兵認為，園區(qū)進行人臉識別將收集他的面部特征等個人生物識別信息，該類信息屬于個人敏感信息，一旦泄露、非法提供或者濫用，將極易危害包括原告在內(nèi)的消費者人身和財產(chǎn)安全。“根據(jù)《消費者權(quán)益保護法》第29條之規(guī)定，園區(qū)收集、使用原告?zhèn)€人信息，應(yīng)當(dāng)遵循合法、正當(dāng)、必要的原則，明示收集、使用信息的目的、方式和范圍，并經(jīng)原告同意；而且，被告收集、使用原告?zhèn)€人信息，應(yīng)當(dāng)公開其收集、使用規(guī)則，不得違反法律、法規(guī)的規(guī)定和雙方的約定收集、使用信息。被告在未經(jīng)原告同意的情況下，通過升級年卡系統(tǒng)強制收集原告?zhèn)€人生物識別信息，嚴重違反了相關(guān)規(guī)定，損害了原告的合法權(quán)益。”

新京報就此事致電杭州野生動物世界，一名工作人員證實，目前指紋識別已取消，入園者只能到年卡中心錄入人臉信息，通過人臉識別入園。該工作人員介紹，人臉識別更方便、快捷，“指紋有時候有點破皮、按(識別)不出來的。”對于外界對個人隱私的擔(dān)憂，該工作人員說，“就你入園掃一下(臉)。”他補充，“指紋也是你的信息，你辦年卡的時候，身份證也留了，電話也留了，這些也是你的信息呀。”

吳卓群表示，人臉識別技術(shù)在技術(shù)上已經(jīng)日趨成熟，在許多圖片識別上，AI的準確率甚至可以高過人工識別，總的來說，技術(shù)是為了方便大家，方便社會，這個技術(shù)發(fā)展本身還是比較好的，但為了防止泄露的風(fēng)險，有必要從制度層面來保證人臉數(shù)據(jù)信息的流轉(zhuǎn)，或者設(shè)置一個標(biāo)準來規(guī)定我們采集后什么能存，什么不能存，從制度和法律上來約束，以防止采集后出現(xiàn)信息泄露的問題。

北京大學(xué)法學(xué)院教授薛軍告訴新京報記者，有必要對人臉識別設(shè)置門檻，“人臉信息伴隨著人的終身，一旦發(fā)生泄露風(fēng)險就特別大，所以要進行最嚴格的保護，首先必須得到用戶明示同意才能收集，我個人認為有時得到個人同意也不行，需要國家授權(quán)才能收集敏感的生物識別信息。”

人臉數(shù)據(jù)可用來做什么？

多用于研究，大量照片用于AI學(xué)習(xí)

事實上，早在人臉識別技術(shù)剛剛興起時，收集大量人臉照片用于機器AI學(xué)習(xí)就成為了人臉識別項目研究的“剛需”。

新京報記者采訪多位從業(yè)者發(fā)現(xiàn)，購買人臉照片的大多是從事人臉識別相關(guān)研究項目的工作人員，人臉數(shù)據(jù)被他們用于訓(xùn)練機器AI的識別精確度。

AI人臉識別研究人員劉澤康向新京報記者介紹，對于AI人臉識別從業(yè)者來說，擁有幾萬張人臉照片并不罕見，他每天都需要將陌生人的人臉照片導(dǎo)入到模型之中，對模型進行優(yōu)化。

“火爆異常的AI換臉背后的工作流程并不難理解，用戶將照片導(dǎo)入后，計算機會通過網(wǎng)絡(luò)模型對照片的像素點進行調(diào)整，從而生成與影視劇中人物表情及所處環(huán)境、光線等相匹配的人臉，實現(xiàn)AI換臉。”劉澤康告訴新京報記者，“為達到換臉的目的，計算機需要對人臉圖像進行大量的數(shù)學(xué)運算，如果圖片數(shù)量過少，模型不夠優(yōu)化，識別不夠精準，計算機便很難較好地實現(xiàn)識別功能。”

新京報記者發(fā)現(xiàn)，劉澤康的電腦中，存放著幾萬張的人臉照片。這些圖片被按照相機種類分別儲存在文件夾中。記者隨意點開劉澤康電腦中的一個文件夾，顯示共包含有2855照片。每個照片的名稱分別為其數(shù)字編號，采集場景及人物表情不盡相同，但均為正常拍攝。

據(jù)劉澤康介紹，這些照片大部分是從網(wǎng)絡(luò)公開的數(shù)據(jù)庫中下載的，也有數(shù)量相當(dāng)可觀的一部分系志愿者提供。“照片不包含志愿者身份信息，故不涉及侵犯公民隱私或者肖像權(quán)的問題。”

百度一名從事AI學(xué)習(xí)的技術(shù)人員對新京報記者表示，從業(yè)者收集大量人臉圖片的目的就是為了機器學(xué)習(xí)。“這本身是一個很枯燥的過程，比如拿到一張男性微笑的圖片，你就人工標(biāo)注‘微笑’然后給機器AI識別，人工標(biāo)注的多了，AI自然就更加精準了，目前這些技術(shù)實際上早已落地，例如火車站人臉識別身份證圖片”。

不過，也有從事隱私檢測的程序員對記者表示，在擁有人臉識別功能后，有些機構(gòu)反而可以更多地截取人臉圖片。“用戶在進行人臉識別時，機構(gòu)在技術(shù)上是可以截存用戶圖片，從而形成自己獨家數(shù)據(jù)庫的，而這些截存下來的圖片有可能他們自己用于訓(xùn)練AI模型，但也不排除用來買賣”。

該名程序員表示，原先有許多人臉識別相關(guān)的AI程序是開源的，“很多人甚至連人臉數(shù)據(jù)庫都不用，可以直接下載已經(jīng)訓(xùn)練好的模型，但自從ZAO引發(fā)爭議后，一些模型和代碼就不再公開了，這樣導(dǎo)致了另一個后果，大家還得自己再找圖片進行AI訓(xùn)練。”

而在劉澤康看來，技術(shù)本身并無原罪。“沒有最精準的人臉識別，只有更精準的人臉識別。以酒店住宿為例，很多人都有過識別慢、難識別、識別條件苛刻等問題。如在目前一些酒店的人臉識別系統(tǒng)中，對于佩戴眼鏡等飾品或強光照等條件下，識別不夠精準，需要一再重復(fù)識別，研究的意義就在于可以擁有更快更精準的人臉識別系統(tǒng)。”

“AI換臉作為一種新型的技術(shù)，各方面配套還有待完善，需要社會各方向積極方面去引導(dǎo)，不能因噎廢食。”劉澤康認為。

“目前，人臉識別技術(shù)已經(jīng)被廣泛運用于智能門鎖、移動支付、手機解鎖等，減少竊密、造假、冒用、頂替等可能，提升安全系數(shù)；在公司、商場、機場、學(xué)校等場景下，人臉識別技術(shù)可以提升管理效率，提升交互體驗；在刑偵及公共領(lǐng)域，人臉識別技術(shù)可以協(xié)助抓獲潛逃多年的犯罪嫌疑人，可以幫助失散多年的家庭團圓，執(zhí)法效率和社會公共安全得以大幅提高。”百度安全總經(jīng)理馬杰對新京報記者表示。

新京報記者羅亦丹李大偉

編輯：秦云

關(guān)鍵詞：識別照片圖片記者信息

免責(zé)聲明：本文轉(zhuǎn)載自其它媒體，轉(zhuǎn)載目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé)，不構(gòu)成投資建議。

欧美成人精品视频在线不卡,久久久这里只有免费精品29,六十路老熟妇乱子伦视频日本,在线观看精品国内

首頁>國企·民企>深·觀察深·觀察

8元買3萬張人臉照片 誰在搜集、買賣你的“臉”？

更多

更多

8元買3萬張人臉照片誰在搜集、買賣你的“臉”？