Windows 12发布时间曝光!重点升级人工智能体验
随着Win11系统23H2大版本更新过后,越来越多消息都在爆料将在今年秋季发布Win12系统,如果属实这也将印证微软已恢复三年一代的系统更新频率,而有消息称微软将把所有赌注都押在人工智能上。

更新日期:2022-07-18
来源:纯净版系统
给你两句话,来品一下它们所蕴含的情感:“我真的会谢。”“听我说谢谢你,因为有你,温暖了四季……”
或许你会说,这很简单啊,不就是最近经常被玩的梗吗?但如果问问长辈,他们可能就是一副“地铁老人看手机”的模样了。
不过与流行文化之间有代沟这事,可不仅限于长辈们,还有 AI。这不,一位博主最近就 po 出了一篇分析谷歌数据集的文章,发现它对 Reddit 评论的情绪判别中,错误率竟高达 30%。
就比如这个例子:
我要向朋友怒表达对他的爱意。
谷歌数据集把它判断为“生气”。
还有下面这条评论:
你 TM 差点吓坏我了。
谷歌数据集将其判别为“困惑”。
网友直呼:你不懂我的梗。
人工智能秒变人工智障,这么离谱的错误它是怎么犯的?
断章取义它最“拿手”
这就得从他判别的方式入手了。谷歌数据集在给评论贴标签时,是把文字单拎出来判断的。我们可以看看下面这张图,谷歌数据集都把文字中的情绪错误地判断为愤怒。
不如我们由此来推测一下谷歌数据集判别错误的原因,就拿上面的例子来说,这四条评论中均有一些“脏话”。
谷歌数据集把这些“脏话”拿来作为判断的依据,但如果仔细读完整个评论,就会发现这个所谓的“依据”只是用来增强整个句子的语气,并没有实际的意义。
网友们的发表的评论往往都不是孤立存在的,它所跟的帖子、发布的平台等因素都可能导致整个语义发生变化。
比如单看这条评论:
his traps hide the fucking sun.
单单依靠这个很难判断其中的情绪元素。但如果知道他是来自一个肌肉网站的评论,或许就不难猜出了,(他只是想称赞一下这个人的肌肉)。
忽略评论的帖子本身,或者将其中某个情感色彩强烈的词语单拎出来判断其情绪元素都是不合理的。一个句子并不是孤立存在的,它有其特定的语境,其含义也会随着语境的变化而变化。
将评论放入完整的语境中去判断其情绪色彩,或许会大大提升判别的准确率。但造成 30% 这么高的失误率可不仅仅只是“断章取义”,其中还有更深层次的原因。
“我们的梗 AI 不懂”
除了语境会干扰数据集判别之外,文化背景也是一个非常重要的因素。
大到国家地区,小到网站社群都会有其内部专属的文化符号,这种文化符号圈层之外的人很难解读,这就造成了一个棘手的问题:若想更准确地判断某一社区评论的情绪,就得针对性地对其社区进行一些数据训练,深入了解整个社区的文化基因。
在 Reddit 网站上,网友评论指出“所有的评分者都是以英语为母语的印度人”。
这就导致会对一些很常见的习语、语气词及一些特定的“梗”造成误解。说了这么多,数据集判别失误率这么高的原因也就显而易见了。
但与此同时,提高 AI 判别情绪的精确度也有了清晰的方向。例如博主也在这篇文章中就给出了几条建议:
首先,在对评论贴标签时,得对他所处的文化背景有深刻地理解。以 Reddit 为例,要判断其评论的情绪色彩,要对美国的一些文化、政治理解透彻,并且还要能够迅速 get 到专属网站的“梗”;
其次,要测试标签对一些讽刺、习语、梗的判别是否正确,确保模型能够整整理解文本的意思;
最后,核查模型判断与我们真实判别,以做出反馈,更好地训练模型。
One More Thing
AI 大牛吴恩达曾发起过一项以数据为中心的人工智能运动。
将人工智能从业者的重点从模型 / 算法开发转移到他们用于训练模型的数据质量上。吴恩达曾说:
数据是人工智能的食物。
用于训练数据的好坏对于一个模型也至关重要,在新兴的以数据为中心的 AI 方法中,数据的一致性至关重要。为了获得正确的结果,需要固定模型或代码并迭代地提高数据质量。
……
最后,你觉得在提高语言 AI 判别情绪这件事上,还有什么方法呢?
欢迎在留言区讨论~
参考链接:
[1]https://www.reddit.com/r/MachineLearning/comments/vye69k/30_of_googles_reddit_emotions_dataset_is/[2]https://www.surgehq.ai/blog/30-percent-of-googles-reddit-emotions-dataset-is-mislabeled[3]https://mitsloan.mit.edu/ideas-made-to-matter/why-its-time-data-centric-artificial-intelligence
Windows 12发布时间曝光!重点升级人工智能体验
随着Win11系统23H2大版本更新过后,越来越多消息都在爆料将在今年秋季发布Win12系统,如果属实这也将印证微软已恢复三年一代的系统更新频率,而有消息称微软将把所有赌注都押在人工智能上。
必应聊天中已有广告出现 用户质疑AI中立性
【本站】3月31日消息,微软正在考虑在其人工智能聊天软件必应聊天中放置广告。微软副总裁Yusuf Mehdi在博客中表示,微软正在“探索在必应聊天中放置广告”,并且希望“与内容贡献给必应的合作伙伴分享广告收入”。据了解,微软在必应上的广告测试已经有一段时
AI研究人员呼吁暂停研发更先进的AI技术
【本站】3月31日消息,特斯拉首席执行官埃隆・马斯克、苹果联合创始人史蒂夫・沃兹尼亚克以及其他上千名AI研究人员签署了一封公开信,呼吁暂停研究更先进的AI技术,以减少强大技术带来的全球灾难性和生存风险。这封信由非营利组织“生命未来研究所”撰写,其
阿里巴巴推广文案生成方法获专利,将提高文案营销效果
【本站】3月31日消息,阿里巴巴(中国)有限公司申请的专利涉及一种文案生成方法、文案优化方法、模型生成方法及计算设备,该申请实施例提供的技术方案可以保证对象推广文案的质量。其中,该技术方案提供了从目标对象相关信息中提取文本元素、组合生成待处理文
减少对单一模型依赖成为AI行业新共识
【本站】3月30日消息,随着AI技术的不断发展,越来越多的公司开始寻找替代OpenAI的AI基础模型。为了减少对单一模型的依赖,同时寻找最适合每项任务、延迟最少、质量最好的模型,一些软件开发商和投资者正在寻找OpenAI的竞争对手。据本站了解,初创
微软必应聊天推出数学解答新格式,用户体验更佳
【本站】3月30日消息,微软必应聊天正在进行一系列的更新和改进,旨在提高用户的聊天体验。最近,微软广告和网络服务部门的负责人Mikhail Parakhin在推特上展示了必应聊天在数学解答中的新格式,这种格式更美观、易读。据本站了解,目前有10%的必应
人工智能领域再迎重量级创业者 搜狗前CEO王小川成立新公司
【本站】3月29日消息,据了解,曾担任搜狗公司CEO的王小川在今年2月份的一条微博中表示,中国需要自己的OpenAI。如今,他似乎正在为这一目标而努力。3月24日,王小川又成立了一家人工智能公司——「五季智能」(北京)科技有限公司。这家公司的注册资本为500万
前搜狗CEO王小川成立五季智能,进军人工智能领域!
【本站】3月29日消息,据股东信息显示,前搜狗CEO王小川近日成立了五季智能(北京)科技有限公司,这家公司的法定代表人就是王小川本人,注册资本为500万元人民币,主要经营范围包括人工智能应用软件开发、人工智能双创服务平台、人工智能理论与算法软件开发、
钟薛高成为百度文心一言合作伙伴,智能化冰品即将来临
【本站】3月29日消息,今天,在上海举办的钟薛高年度新品发布会上,推出了一款名为Sa'Saa的雪糕。据创始人林盛称,这是一款由AI打造的雪糕,名字、包装、口味、图片等都是由AI设计、建议或自动生成。值得一提的是,Sa'Saa雪糕定价只有3.5元,较钟薛高
百度表示:AI创作时代给创作者带来更多机会与自由
【本站】3月28日消息,百度在“2023百度内容生态共生大会”上表示,AI创作时代之于创作者,是蛋糕变大了而不是变小了,是机会更多了而不是更少了。AI的每一次创新与进化也都是为了提高社会生产力,为人类带来更多的自由与可能。百度搜索每天响应来自100多个国
中国人工智能领域著名科学家涂序彦先生逝世,享年88岁
【本站】3月28日消息,我国人工智能领域著名科学家、教育家涂序彦先生于1月1日逝世,享年88岁。涂先生是人工智能学科的主要奠基人之一,中国人工智能学会的主要创始人之一,也是北京科技大学计算机与通信工程学院的教授和博士生导师。涂先生将一生奉献给高等
Depay无法充值ChatGPT了吗?Depay充值ChatGPT提示信用卡被拒怎么办?
近期有很多用户反馈称无法通过depay充值订阅chatgpt账号了。更有各种传言说depay是骗子,根本无法充值chatgpt,小编经过很久的研究,发现其中的原因。首先,我们可以肯定的是depay完全是没有问题,100%可以正常充值订阅chatgpt,出现“您的信用卡被拒绝了”这个问题并不
百度推出“文心千帆”大模型平台
【本站】3月27日消息,百度智能云已经在闭门交流会上正式推出了名为“文心千帆”的大模型平台,该平台旨在向客户提供企业级大语言模型服务。据了解,文心千帆大模型平台不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链。未来,文心千帆还会支
人工智能头部公司并未跟进?中国企业为何错失ChatGPT浪潮
【本站】3月27日消息,OpenAI的ChatGPT发布仅4个多月火爆出圈,引发业内轰动,最新的GPT-4大模型又进一步提升了ChatGPT的能力,一时间,全球各大互联网公司都在跟进推出生成式AI对标ChatGPT。据经济观察报报道,市场巨大的牵引力可能会倒逼上游的创新,但是在
马云谈人工智能 应该用AI去解决问题 而不是被AI所控制
【本站】3月27日消息,近日有网友在国内短视频平台上传了一段在杭州偶遇阿里巴巴集团创始人马云的视频。视频中马云乘坐一辆考斯特汽车,同时有媒体报道称车内还有阿里巴巴集团董事会主席兼首席执行官张勇以及蚂蚁集团执行副总裁邵晓锋。马云现身云谷学校,并