留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于模糊综合评判的媒体新闻数据清洗方法研究

魏俊杰,何翼,熊黄,庄辉

魏俊杰,何翼,熊黄,庄辉. 基于模糊综合评判的媒体新闻数据清洗方法研究[J]. 中国传媒科技, 2022, (11): 156-160. doi: 10.19483/j.cnki.11-4653/n.2022.11.036
引用本文: 魏俊杰,何翼,熊黄,庄辉. 基于模糊综合评判的媒体新闻数据清洗方法研究[J]. 中国传媒科技, 2022, (11): 156-160. doi: 10.19483/j.cnki.11-4653/n.2022.11.036

基于模糊综合评判的媒体新闻数据清洗方法研究

doi: 10.19483/j.cnki.11-4653/n.2022.11.036
详细信息
    作者简介:

    魏俊杰,何翼,熊黄,庄辉:魏俊杰(1981-), 男,广东惠州,高级工程师,研究方向:大数据技术与应用;何翼(1990-),女,湖南汨罗,中级软件设计,研究方向:信息安全;熊黄(1975-), 男,湖北武汉,研究方向:云计算与存储;庄辉(1991-),男,广东揭阳,软件设计师,研究方向:软件工程。

  • 中图分类号: G621

  • 摘要: 【目的】随着自动撰稿技术的发展和移动终端的普及,媒体新闻数据量呈现爆发式增长,给舆论研究人员和舆情监测工作带来了极大的挑战。[1] 针对海量新闻稿件的采集、筛选工作,仅依靠人工处理或简单的语义查询技术,已无法高效应对。【方法】文章利用模糊综合评判模型对新闻数据进行清洗的方法。【结果】得到有效减少数据处理总量和去除数据噪声的结果,进而形成适用于报业集团舆情数据的清洗规则库,并通过评判等级和隶属函数确定具体评级分数。【结论】最终得出有效提升舆情监测和处理效率的清洗方法。

     

  • [1] 王楷鑫,鄢睿,王立国,王双立.新媒体数据分析与应用浅析[J].中国传媒科技,2021(10):145-148.
    [2] 郝爽,李国良,冯建华,王宁.结构化数据清洗技术综述[J].清华大学学报(自然科学版),2018(12):1037-1050.
    [3] 吴信东,董丙冰,堵新政,杨威.数据治理技术[J].软件学报,2019(9):2830-2856.
    [4] 韩孟婷,柴彬彬,马立民.大数据环境下高校新媒体舆情分析模型的探索与实践[J].北京教育(高教),2020(4):76-78.
    [5] 廖书妍.数据清洗研究综述[J].电脑知识与技术,2020(20):44-47.
    [6] 陈舒枝.舆情大数据系统的设计与实现[J].无线互联科技,2020(15):72-73.
    [7] 李洪烈,夏栋,王倩.基于回归模型的采集数据清洗技术[J].电光与控制,2022(4):117-120.
    [8] 黎伟健,胡斌,李威,唐健玲,肖西西.大数据视角下的非结构化文本挖掘分析方法[J].新媒体研究,2021(8):8-10+52.
    [9] 米允龙,李金海,米春桥,刘文奇,刘佳,王添.基于区间模糊匹配函数的数据清洗算法研究及其在问卷调查中的应用[J].南京师范大学学报(工程技术版),2017(3)70-79.
    [10] 陈珺.媒体大数据服务平台设计与构建方法研究[J].中国传媒科技,2018(9):64-66.
  • 加载中
计量
  • 文章访问数:  199
  • HTML全文浏览量:  21
  • PDF下载量:  24
  • 被引次数: 0
出版历程
  • 刊出日期:  2022-11-15

目录

    /

    返回文章
    返回