本项目需要建设一个标准统一的全国报刊电子样本库,并采用计算机智能分析等计算机分析技术对样本库中的报刊内容进行多维度的内容挖掘和分析,采用“机器为主、人工为辅、人机结合”方式实现报刊内容的监测工作。同时,将样本库的报刊新闻稿件作者与中国记者网的记者数据对接,将记者信息与其发表的新闻稿件情况建立数据关联,通过分析记者发表的新闻稿件的数量和质量情况实现对记者业务工作的有效评价。主要包括如下几个部分:

•样本提取系统
•样本提交系统
•内容管理和运维系统
•报刊内容监管分析系统
•记者稿件评价系统
•智能平板电脑读报系统

CNML-NAF标准旨在提供一种科学的报纸资料的数字化描述格式,力求降低报纸数字资源的存储和流通成本,进而促进数字出版产业的发展。

CNML-NAF标准致力于提供报纸新闻长久保存和再利用的文档格式,这里所说的长久保存是指:以该文档格式保存的数据包不依赖于任何软件系统,利用格式标准和数据包内的信息就可以完全掌握和理解其中的内容信息,数据包是自解释的。