加载中…
个人资料
  • 博客等级:
  • 博客积分:
  • 博客访问:
  • 关注人气:
  • 获赠金笔:0支
  • 赠出金笔:0支
  • 荣誉徽章:
正文 字体大小:

协同的非结构化信息的知识管理与应用

(2010-09-25 23:47:52)
标签:

致远软件

全文检索

知识管理

非结构化信息

it

分类: 专家观点

协同管理软件行业的比较统一的看法是以非结构化信息的管理为主,形成了以流程+正文的沟通方式,结合公告、新闻、讨论等各种手段,整合互联网的html以及各种组合的正文+附件的文档结构,形成了对知识的描述。

显然,由于协同管理软件的知识是随着事件、活动、任务而产生,是对协作工作的一次次记录而成真实的映像,信息量非常庞大,典型的300-500人应用的系统,一年的文档信息量将达数十个Gbytes,这些信息组织得好,就会是不错的知识财富,反之则会成为新的信息垃圾,而其中有夹杂着各种有用的信息。

这么大量的文档信息如何进行分类、聚合和搜索使用,是信息到知识跃进的关键,这里需要回答的核心问题有:

1)全文检索引擎如何使用?

2)如何建立有效的权限防护以加强对文档的管理?

3)是否需要对文档的查看、下载和使用进行计量,甚至写入日志进行跟踪?

解决以上问题,需要结合组织模型体系,并且结合全文检索的引擎机制进行解析,其核心点在于:

1)全文检索引擎的机制与数据库的关系完全不同,这是基于字、词切分的结构,因而需要以文档中包含有什么进行区隔;

2)需要充分考虑文档的标题、作者、评价与回复等各种信息及其组合,包括人为加入的主题词、关键词等信息,这些信息很多时候是对文档的归类聚合的过滤器,这是企业管理软件对组织内信息利用的核心,因为这些知识不同于互联网的知识具有随意性,而这里是有不同的归类条件的;

3)需要结合权限体系、密级、重要度等信息进行考虑,有效地进行体系化的库文档结构的设计与管理。

一句话,需要以非结构化信息以词为主进行应用级与技术整合的设计,形成高效的库、词的结构,需要排除以关系数据库的数据集进行搜索设计的算法思考,而以全文检索对于字、词的使用为基础进行。

致远软件的A8系统已经解决了这些问题,A6协同的新版进行了改进,将推出基于全文检索的非结构化信息的展现应用。。。

 

0

阅读 收藏 喜欢 打印举报/Report
  

新浪BLOG意见反馈留言板 欢迎批评指正

新浪简介 | About Sina | 广告服务 | 联系我们 | 招聘信息 | 网站律师 | SINA English | 产品答疑

新浪公司 版权所有