法律监管+技术人工审核:提升AI内容输出可控性
创始人
2024-11-23 10:31:04
0

AI聊天角色在回答中可能出现色情擦边、暴力对话等情况,主要与“数据来源的混杂性、商业模式的诱导性、监管机制的滞后性”这三大关键因素有关。

从数据来源维度剖析,AI剧情聊天软件背后的大语言模型,其训练数据主要来源于对话式小说或提取自小说的文本内容。然而,网络小说数量巨大且质量参差不齐,其中不乏包含色情、擦边以及暴力的内容。如果这些内容没有被有效过滤,模型在输出时就容易出现问题。

从商业模式视角审视,部分AI剧情聊天软件为吸引用户,即便在青少年模式中,仍存在允许“擦边对话”的现象。例如通过设定极富想象力的剧情和风格迥异的人物角色来打动用户,这种商业模式不仅推动了用户黏性增长,但也容易诱导用户实施不适当行为。

从监管角度考量,目前针对AI生成内容的监管机制尚不完善,许多平台也可能缺乏有效的内容过滤技术措施,导致一些含有色情、暴力等不当内容的对话能够顺利输出给用户。

虽然相关企业通常会实施内容修订流程等操作,甚至建立用户反馈机制,根据用户的年龄段、身份特征等因素,限制未成年用户访问包含敏感或禁止内容在内的数据源,但实际上,受制于商业利益、技术不足等因素,全面的内容审查与控制难以实现。

为了应对这种情况,可进一步优化大语言模型的筛选机制,以降低甚至杜绝涉黄、暴力或侮辱性内容的输出。比如对于隐蔽或隐喻等内容,可通过开发长记忆链技术来更好地捕捉语言中的长距离依赖关系,提高模型对不当内容的识别和过滤能力;或者利用词嵌入、序列模型与注意力机制等技术,来增强模型对文本内容的深度剖析能力。通过强化技术手段,模型能够更精确地理解文本中的上下文关系,从而更准确地判别文本是否包含不当内容。

但需明确的是,技术不能解决所有的问题,还需要法律及人工介入等多种方式协同解决内容输出控制的问题。从法律角度,对用于训练大语言模型的数据进行严格的筛选与分类,确保数据源合法且内容健康,坚决剔除包含色情、暴力等不当元素的文本数据。对于现有的模型,可运用数据遗忘等技术手段,消除已有模型的不当内容输出或在干净数据上的重新训练,生成优质大模型。此外,引入人工审核机制是一种必要的手段,对自动化系统标记为敏感或禁止的内容进行人工复核,推动开放研究、社区合作、线索举报等多种措施,进一步优化大语言模型的筛选机制,最大限度减少或消除不良内容的输出。

不良内容的输出,会对受众的思想行为产生较为严重的负面影响。更深远的影响在于,通过AI大模型的使用去改变受众的认知,影响认知安全。

相关内容

热门资讯

“中国版英伟达”,中签号公布! 25日晚间,被市场视为“中国版英伟达”的摩尔线程,发布首次公开发行股票并在科创板上市网下初步配售结果...
华与华创始人华杉称西贝“被人算... 红星资本局11月26日消息,日前,“西贝员工回应涨薪500元”的话题在社交平台引发关注,西贝品牌顾问...
原创 日... 近期,国际局势呈现出令人瞩目的动向。美日首脑之间的通话,特别是特朗普对高市早苗的突然联系,无疑投射出...
厦门渊亭信息科技取得恶意诉讼智... 国家知识产权局信息显示,厦门渊亭信息科技有限公司取得一项名为“恶意诉讼智能监督方法、系统、设备及存储...
李在明评高市言论:引起相当大争... 【文/观察者网 齐倩】 近日,东北亚局势骤紧。日本首相高市早苗挑起中日外交争端,中方予以强力反制。...
原创 特... 在当前复杂多变的国际关系中,尤其是亚洲地区的地缘政治局势,日美之间的亲密合作无疑成为了一个引人瞩目的...
今晚很多股民都在晒截图:“很遗... 11月25日晚间,摩尔线程发布首次公开发行股票并在科创板上市网下初步配售结果及网上中签结果公告,本次...
“撤回发言,立即辞职!”日本爆... “我们会持续进行抗议,一场一场地抗争下去。”一名日本民众说道。日本首相高市早苗近日涉台错误言论,已在...
山东推动三项制度改革,经理层薪... 齐鲁晚报·齐鲁壹点记者 张玉岩 11月26日,山东省政府新闻办举行新闻发布会,邀请省国资委负责同志等...
政策托底+执法护航!江苏近20... 10月22日,南京39艘老旧营运船舶拆解全部完成;11月8日,扬州94艘老旧营运船舶中的最后一艘成品...