宏观 华财讯 证券 产经 消费 科技 房产 酒业 银行 保险 智慧家

知乎优化AI算法建立互联网社交规则 杠精难题有救了

2018年06月26日 09:22 来源:TechWeb.com.cn
分享: 微信

【TechWeb报道】6月25日消息,随着网络的发达,在网络上精于抬杠的人越来越多,这群人就是所谓的“杠精”,一个20字以内的主谓宾简单句,就能让人无语凝噎,而被抬杠的人往往是受伤又无奈。知识分享平台知乎近日宣布要治治这些杠精了。

知乎运营总监孙达云

在知乎平台,杠精也被称为“阴阳怪气”,知乎运营总监孙达云告诉TechWeb,过去一年,知乎都在探索对阴阳怪气类评论的解决方案,其运用的是算法机器人“瓦力”,近期知乎还将对该技术进行产品化尝试。

瓦力如何破解“阴阳怪气”类评论

据孙达云介绍,知乎治理“杠精”的初衷是因为阴阳怪气类评论极大伤害了创作者和交流者的体验。这种行为通常以“不针对发言内容,而是批评对方的语气”以及“提出反对意见,但不给或给出极少数论据支持”这两类常见言论为代表。

不过,因为网络语言的复杂性,这类评论很难解决。例如经典的“呵呵”,由于双方不同关系、说话的不同场景和时间都会带来迥然不同的表意。即便是人工判定都存在标准化难度,算法模型的训练挑战就更为艰辛。

经过知乎团队的不懈努力,“瓦力”成为最新的阴阳怪气技术解决方案。

知乎内容质量管理团队技术负责人刘兆来

知乎内容质量管理团队技术负责人刘兆来解释称,针对阴阳怪气评论通常表达负面情感的特点,知乎构建了内容情感倾向性识别的算法模型和识别用户亲密度的模型,针对阴阳怪气评论的典型特征,建立了文本识别模型不断标记训练样本。

刘兆来表示,三大模型的结合不仅摆脱了单一算法模型的局限性,也让“瓦力”的阴阳怪气识别准确率超过了大多数人工判断。具体来说,就是瓦力会首先通过知乎社区里的举报、反对等负向用户行为收集训练数据。然后通过各种同义替换、规则模版方式对训练数据进行扩展,以缓解训练数据稀疏的问题。同时,“瓦力”提取文本、句法、表情符等特征,并利用一个带attention的CNN和LSTM的融合模型进行分类,最终判断出内容是否为阴阳怪气。

刘兆来向TechWeb等表示, 优化技术方案后,“瓦力”已能实现对“暗藏玄机夸奖”(忍不住关注答主了,你的答案很有水平!你博士快毕业了吧!)、“好为人师”(我觉得你挺惨,虽然长这么大了,还真应该回小学改造)、“强行反驳”(你开心就好、请开始你的表演)等数类阴阳怪气内容的识别。

据TechWeb了解,有部分用户会将一些“阴阳怪气”类的评论视为神评论,甚至对这些神评论的关注超过了事件本身,如果去掉这些神评论,只剩下就事论事的评论,是否会影响用户体验?

对此,刘兆来回应说,具体的落地会考虑一些特征,比如在用户间熟悉的情况下,一些阴阳怪气的评论可能只是开玩笑,但在陌生人间就有了嘲讽的意味。知乎的情感倾向性识别的算法模型和识别用户亲密度的模型就是针对这块设计的。此外,用户也可以自己选择要不要用这个功能。

瓦力未来的应用方向有哪些?

知乎在2016年推出了算法机器人瓦力,主要用于治理平台上的谩骂、答非所问、贴标签等不友善内容,如今进一步升级后,用来挑战“阴阳怪气”类评论的治理。

在深度学习的AI大潮中,知乎的AI技术也在运用到越来越多的板块。比如现在通过站内数据做的知识图谱,识别图文相关性,以此来判断图片是否违规或含有不良信息等。

此外,还有对视频的理解。刘兆来称,现在视频主要还是靠人工审核比较多,后面会通过算法对现在做的短视频进行识别。比如,对视频打标签,根据视频的标签或者文本,对问题或者评论的文本判断相关性。

对于介于不同标准之间的打标签行为,刘兆来称,会结合人工进行上下文语境判断。比如用户点“踩”比较多,被举报了,但通过不友善模型识别又没有辱骂词,这种情况就需要结合人工审核来做判断。

据介绍,目前,知乎借助AI技术,并辅以人机结合和多元的产品举措,多重手段加强对社区氛围的维护。现阶段,知乎已实现对95%以上的违法违规、广告导流和不友善等内容的主动打击、覆盖和筛查 。(周小白)

(责任编辑:CF001)

推荐阅读 相关文章

AI独角兽CEO被告上法庭了

钱在哪儿,官司就在哪儿。...

来源:投中网

国家网信办等七部门联合公布《生成式人工智能服务管理暂行办法》

国家网信办有关负责人并就《办法》相关问题回答了记者提问。...

来源:网信中国微信公众号

“Chat”并不是全部,中国AI发展要走深向实

华为有两个着力点:第一,打造强有力的算力底座,来支撑中国人工智能产业的发展。第二,真正让人工智能服务好千行百业,服务好科研创新。...

来源:观察者网

苹果何以3万亿

如果说iPhone是苹果起飞的原点,那在如今“AI的iPhone时刻”,市场也在等待着下一个3万亿。...

来源:北京商报

七牛云赴港IPO,云计算“价格战”打响,何以破局

差异化成为创新创业云计算企业突围的法宝,七牛云能找到这样一条不同寻常的路?...

来源:蓝鲸

人工智能将如何重塑未来教育?

人工智能技术与教育数字化领域深度融合将为教育的未来带来更多可能性,...

来源:人民网

环球市场:背靠华尔街巨头的新交易所上线 比特币重新站上2.8万美元

①拜登之子的刑事案件被轻松解决,引发特朗普公开抨击; ②美国国会两党共同提议设立国家AI委员会; ③全球围观中东国资“买买买”,24小时...

来源:财联社

“ChatGPT+”生态渐近?OpenAI或将推出AI模型商店

①这一商店,让开发者可以上架他们基于OpenAI技术搭建的产品; ②企业AI平台公司Aquant、在线教育服务商可汗学院都有兴趣加入这个商...

来源:财联社

苹果股价3万亿美元,瑞银则下调评级:iPhone销量将走下坡路

①在周二的报告中,瑞银分析师David Vogt及其团队将苹果股票评级从“买入”下调至“中性”; ②Vogt认为,iPhone需求将出现疲...

来源:财联社

达里奥:AI“美妙又危险” 唯一风险在于……

①达里奥表示,AI是一项令人难以置信的技术,它将创造巨大的力量; ②唯一的风险在于使用它的人。...

来源:财联社

拿下“问界”商标!华为到底造不造车?

华为不单独造车,意欲与车企一起造好车。...

来源:时代周报

苹果发布首款头显,概念全线大跌

6日早盘,A股小幅震荡,主要股指涨跌互现,白马蓝筹股相对强势,上证50指数盘中一度直线拉升涨逾1%,创业板指则再创1年多来新低。...

来源:凤凰网财经

望尘科技敲开上市大门:产品阵营单薄、仅靠三款游戏盈利,《足球大师》运营接近尾声

2022年底,手机游戏开发商、发行商及运营商望尘科技通过港交所主板上市聆讯。这是望尘科技第三次冲击上市,此前其曾于2021年6月及2022年...

来源:蓝鲸财经

国美电器收到破产清算呈请,国美零售称债权债务尚未确认

国美零售日前发布公告称,其附属公司国美电器近日收到法院破产清算申请,申请人主张追讨货款470.6万元,但这些债权债务并未有生效法律文书予以确...

来源:蓝鲸财经

张勇亲自出手给阿里云“紧紧弦”

每年“双11”后,阿里通常会进行组织架构调整,2022年的重点是阿里云。...

来源:北京商报

游戏厂商苦捱寒冬,年内512款游戏获批,近6成杳无音信

回顾全年512款版号获批游戏的情况,大部分至今未能正式上线,其中不少游戏甚至很可能等不到上线的那一天。...

来源:时代财经

国美电器新增一则被执行人信息,标的超9677万元

天眼查App显示,近日,国美电器有限公司、西安市国美电器有限公司、新疆国美电器有限公司新增一则被执行人信息,执行标的9677万余元,执行法院...

来源:蓝鲸财经

囤药潮下,医药电商的红与黑

近期,随着疫情防控政策的进一步优化,居民对于看病问诊、防疫物资、相关药品等的需求出现井喷,部分人在寻医用药焦虑下开启了囤药潮,进一步加剧了买...

来源:蓝鲸财经

新年促销被指去库存,苹果在中国卖不动了?

12月27日,苹果中国官网开启了新一轮的“立减活动”,2022年12月30日-2023年1月2日,用指定支付方式购买符合条件的产品可享立减优...

来源:北京商报

知网回应被罚:诚恳接受,坚决服从,公布15项整改措施

据“CNKI知网”12月26日披露,自5月13日国家市场监督管理总局对知网涉嫌垄断立案调查以来,我们全力配合,深刻反省,全面自查。今天,我们...

来源:新京报

舜宇光学科技与诚瑞光学打响“专利战”,手机镜头出货量不断下滑之下如何破局?

年关将至,光学巨头舜宇光学科技与诚瑞光学的“专利战”却打得不可开交。...

来源:蓝鲸财经

年关将近在线婚恋诈骗再起,“珍爱”路上如何为个人信息上锁?

作为承载脱单重任的婚恋平台,成为不法分子借以实施犯罪的抓手,利用头部婚恋平台的高知名度和消费者希望结缘的精准心理进行诈骗的情况已屡见不鲜。据...

来源:蓝鲸财经

被罚8760万后知网知错

耗时长达半年的知网涉嫌垄断案终于尘埃落定。...

来源:北京商报

知网因滥用市场支配地位被罚

2022年5月,市场监管总局依据《反垄断法》对知网涉嫌实施垄断行为立案调查。...

来源:人民网

芯片寒冬下逆势而行!三星明年或扩大其最大半导体工厂产能

韩国芯片制造商三星电子计划于明年增加其平泽P3工厂的芯片产能,而其对手企业正纷纷选择缩减投资。...

来源:财联社

联系方式

中华网新媒体 财经频道
互动/投稿邮箱:
finance@zhixun.china.com
网上不良信息举报电话:010-56177181
财经频道联系电话:(010)56176102