圖:香港大學(xué)舉辦人工智能教育博覽,提高社會(huì)對(duì)人工智能技術(shù)和素養(yǎng)的認(rèn)識(shí)。
使用數(shù)據(jù)訓(xùn)練AI大模型,有潛在侵權(quán)風(fēng)險(xiǎn),特別是當(dāng)訓(xùn)練數(shù)據(jù)涉及受版權(quán)保護(hù)的內(nèi)容、個(gè)人信息或受限制的商業(yè)數(shù)據(jù)。2023年,美國紐約時(shí)報(bào)起訴OpenAI與微軟,指控ChatGPT在未經(jīng)授權(quán)的情況下複製其文章內(nèi)容用於訓(xùn)練,且生成的回答可逐字復(fù)現(xiàn)原文段落,侵犯版權(quán)。爭議焦點(diǎn)在於,模型輸出是否構(gòu)成「演繹作品」,以及訓(xùn)練階段的臨時(shí)數(shù)據(jù)複製是否適用「合理使用」。簡單來說,該案涉及「數(shù)據(jù)價(jià)值分配權(quán)」,判決結(jié)果將重塑AI行業(yè)的數(shù)據(jù)獲取成本與創(chuàng)新速度。隨著數(shù)據(jù)抓取時(shí)代邁步「合規(guī)化」,授權(quán)數(shù)據(jù)生態(tài)逐步的建立,對(duì)推動(dòng)AI創(chuàng)新具有重大意義。