100 萬本公共領域書籍,為 AI 訓練提供合法數據

        2024-12-17

        來源:IT之家

        據 TechCrunch 12 日報道,哈佛大學與谷歌宣布,聯合發布 100 萬本公共領域書籍作為 AI 訓練數據集。

        AI 訓練所需的數據成本高昂,但卻更適合資金充裕的科技公司。因此,哈佛大學計劃發布一個包含約 100 萬本公共領域書籍的數據集,這些書籍覆蓋多種類型、語言和作者,包括已不再受版權保護的經典作家如狄更斯、但丁和莎士比亞等,因這些作品的版權已隨時間過期。

        雖然這個新數據集尚未公開,也不清楚具體的發布方式和時間,但它來源于谷歌的長期項目 —— 谷歌圖書(Google Books)。因此,谷歌將參與這次“寶貴財富”的廣泛發布。

        據IT之家了解,早在今年 3 月,哈佛大學就曾透露其“機構數據計劃(IDI)”,并表示這一計劃旨在為 AI 提供“合法數據的可信通道”。直到正式啟動后,該計劃才確認得到了微軟和 OpenAI 的資金支持。

        IDI 的執行董事格雷格?萊佩特(Greg Leppert)表示,該數據集的目標是“讓競爭環境更加公平”,通過向包括研究機構和 AI 初創公司在內的各類機構開放這一龐大的數據集,以幫助他們訓練大型語言模型。



        更多新聞
        火山引擎×上汽集團:共建汽車全場景AI新體驗

        火山引擎×上汽集團:共建汽車全場景AI新體驗

        Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

        Moka AI 探索實踐:七年技術深耕,從單點突破到招聘全流程閉環

        2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

        2025快手磁力大會:加速“生成新商業”,AI全面重塑商業經營

        主站蜘蛛池模板: 亚洲人成在线播放网站岛国 | 大肉大捧一进一出好爽视频mba| 乱色精品无码一区二区国产盗| 男女做爽爽免费视频| 国产午夜精品福利| 91在线精品中文字幕| 成人欧美在线视频| 九色综合狠狠综合久久| 波多野结衣伦理视频| 啊轻点灬大ji巴太粗太长h| 国产福利兔女郎在线观看| 在公交车上被站着被c| 与子乱刺激对白在线播放| 日韩欧美亚洲视频| 亚洲国产欧美日韩一区二区三区| 粗壮挺进人妻水蜜桃成熟| 国产乱子伦在线观看| 天天影视色香欲性综合网网站| 大佬和我的365天2在线观看| 中文字幕一区二区精品区| 日韩精品免费一级视频| 亚洲欧洲日产韩国在线| 精品人妻中文字幕有码在线| 国产乱来乱子视频| 欧美极品另类高清videos| 国产高清一级片| zoosk00lvideos性印度| 无码av天天av天天爽| 久碰人澡人澡人澡人澡人视频| 欧美精品九九99久久在免费线| 免费无遮挡无码永久视频| 色噜噜狠狠成人网| 国产嫩草在线观看| www.亚洲日本| 国产精品香蕉在线一区| a级毛片在线免费| 成人av在线一区二区三区| 久久久久无码精品国产| 最新孕妇孕交视频| 亚洲大片在线观看| 毛片免费视频观看|