AI生成声音侵权案:自然人声音权益可及于AI生成声音
——殷某某诉某智能科技公司等人格权侵权案
【典型意义】
本案明确声音作为一种人格权益,具有人身专属性,自然人声音权益及于利用人工智能合成的声音,对录音制品的授权并不意味着对声音AI化的授权,未经权利人许可,擅自使用或许可他人使用录音制品中的声音构成侵权。本案裁判结果在保护自然人声音权益与引导AI技术向善发展等方面具有重大积极意义,有助于推动声音权益保护工作进一步发展。
【基本案情】
原告殷某某是一名配音演员,其经朋友告知,发现他人利用其配音制作的作品在多个知名APP广泛流传。经声音筛选和溯源,发现上述作品中的声音来自于被告一某智能科技公司运营的平台中的文本转语音产品。原告曾接受被告二某文化传媒公司的委托录制录音制品,被告二为录音制品的著作权人。后被告二将原告为其录制的录音制品的音频提供给被告三某软件公司。被告三仅以原告录制的一部录音制品作为素材进行AI化处理,生成了涉案文本转语音产品并在被告四某网络科技公司运营的云服务平台对外出售。被告一某智能科技公司与被告五某科技发展公司签订在线服务买卖合同,由被告五向被告三下单采购,其中包括了涉案文本转语音产品。被告一某智能科技公司采取应用程序接口形式,在未经技术处理的情况下,直接调取并生成文本转语音产品在其平台中使用。原告主张,被告的行为已经严重侵犯了原告的声音权益,被告一某智能科技公司、被告三某软件公司应立即停止侵权、赔礼道歉,五被告应当赔偿原告经济损失、精神损失。
【裁判要点】
一、原告声音权益及于涉案AI声音
自然人声音以声纹、音色、频率为区分,具有独特性、唯一性、稳定性特点,能够给他人形成或引起一般人产生与该自然人有关的思想或感情活动,可以对外展示个人的行为和身份。自然人声音的可识别性是指在他人反复多次或长期聆听的基础上,通过该声音特征能识别出特定自然人。利用人工智能合成的声音,如果能使一般社会公众或者相关领域的公众根据其音色、语调和发音风格,关联到该自然人,可以认定为具有可识别性。本案中,因被告三系仅使用原告个人声音开发涉案文本转语音产品,而且经当庭勘验,该AI声音与原告的音色、语调、发音风格等具有高度一致性,能够引起一般人产生与原告有关的思想或感情活动,能够将该声音联系到原告本人,进而识别出原告的主体身份。
二、被告关于获得原告合法授权的抗辩不能成立
被告二对录音制品享有著作权等权利,但不包括授权他人对原告声音进行AI化使用的权利。被告二与被告三微软中国公司签订数据协议,在未经原告本人知情同意的情况下,授权被告三AI化使用原告声音的行为无合法权利来源。因此,被告二、被告三关于获得原告合法授权的抗辩不能成立。
三、未经许可使用原告声音构成侵权
被告二、被告三未经原告许可AI化使用了原告声音,构成对原告声音权益的侵犯,其侵权行为造成了原告声音权益受损的后果,应承担相应的法律责任。被告一、被告四、被告五主观上不存在过错,不承担损害赔偿责任。因此,综合考量被告侵权情节、同类市场产品价值、产品播放量等因素,对损害赔偿予以酌定。
【裁判结果】
被告一、被告三向原告书面赔礼道歉,被告二、被告三赔偿原告经济损失25万元。双方当事人均未提起上诉。
(来源:北京互联网法院)