服务中心  我的原文索取  帮助
 
  您现在的位置是:
  学术讲座详细信息  

如何确定一个数据集中的聚簇个数?
[发布时间:2010-5-27 16:23:14]
讲座题目 如何确定一个数据集中的聚簇个数?
时间 2010-5-28 9:00:00
地点 中国科学技术信息研究所三层333教室
主讲人 徐硕 博士
主讲人简介

徐硕,2003年获理学学士学位,2008年中国农业大学农业电气化与自动化专业,研究方向为计算机网络与智能信息处理,主要从事生物数据的数据挖掘工作,获工学博士学位。2008至今,进入我所从事博士后科研工作,合作导师为乔晓东研究员、朱礼军副研究员,研究课题为知识组织系统自动构建与应用关键技术研究。参与或主持的项目包括“十一五”国家科技支撑计划重点项目子课题、国家863项目、教育部人文社科研究项目、所重点工作项目、江苏省社科基金项目等。近5年来在国内外期刊和会议上发表或录用学术论文20余篇。

讲座介绍

聚类分析就是将研究对象划分为不同的聚簇,使得每个聚簇中对象间的相似度尽可能高,而不同聚簇中对象间的相似度尽可能低。通过观察二维散点图人们可以很容易指出对应数据集中的聚簇结构,但让计算机从数据集中自动识别潜在的聚簇结构并不是一件容易的事。困难之一在于如何准确估计数据集中包含的聚簇个数,其根本原因在于目前缺乏一个评价聚类结果质量以及比较两种聚类结果的客观方式。
 本报告将确定聚簇个数的方法分为三大类:内部度量法、外部度量法以及基于聚类稳定性的方法。除了对每种方法的原理进行介绍之外,还将重点介绍每种方法的优缺点以及各种方法间的关系,并针对一种典型应用场景给出一些指导性建议。

资料下载

版权声明 | 关于我们 | 联系方式 | 读者反馈 | 问题解答 | 相关链接 | 网站地图
地址:北京市海淀区复兴路15号 邮编:100038 办公电话:010-58882033 办公传真:010-58882590
服务电话:010-58882060 服务传真:010-58882347

中国科学技术信息研究所 版权所有 京ICP备10027328号