1、“.....同时将档中,以便后续聚类结果分析的对比分析。如下图示图理替换后的源数据图对应的编号地址用数字代号以示,如对映的进行替换,同时将址与对应的数字代码存储在档中,以便后续聚类结果分析的对比分析。如图示图户理后的源数据图户对应的编号下用户码和其访问的址编码,如图示图终输入数据整理完成后,对用户行统计,共有址个,址个,去掉访问请求未成功的记录,共有访问记录万多条。据存储数据存储方式本次设计采用矩阵存储的方式进行数据存储,首先定义个足够大的静态整形二维数组做为据存储矩阵。其中矩阵元素的初值根据不同算法有不同的要求值算法中阵元素的初值我们知道,同个能被同个问多次,从本是否被访问的角度上来讲,我们只要考虑该否有被问......”。
2、“.....若无则置而均值聚类的算法还将访问频率,即被访问的次数做为分类的参考因子,所以在阵元素值为问的次数,相应的代码如图示法中阵元素的初值在法中,我们只考虑否有被问过,若有,不管访问几次只要有被访问就将阵元素值置,若无则置址存储本次网页聚类系统的设计中,对于聚类结果的显示,本设计可以显示每个分类中具体的号对应的具体的址,所以在初始化编程数据时,需要对应编号进行存储,以便要显示具体模块功能介绍均值聚类算法实现模块该模块主要是在均值初始化的数据矩阵的基础上,通过计算阵的行向量间的距离将所有网页归入事先定义好的类别中,而后重新计算出每类也就是自定义类别中的平均值,再进行分类,直到分类不再变化为止,即分类结束......”。
3、“.....没有事先自定义分为几类,而是在初始化矩阵的数据基础上,构造出个新的阵,其中每个元素的值为不同元素的个数,而后算出值,然后根据阈值来进行类,如果大元素值小于阈值,则类。类结果显示模块由于聚类的结果是要将分类后的示给用户,然而我们知道共有个,如果全部起显示给用户会使用户无法清晰地分析聚类的结果,所以我们先在显示出分类后的号,每类的显示在的行,由于显示的窗口大小有限,所以有些类含多无法在行中全部显示给用户,所以用户双击这行,则会显示出全部的号,而后点击详细显示,则显示详细的号与地址。第章系统实现本章主要包括两种聚类算法均值聚类和类的实现,以及聚类结果的分析显示......”。
4、“.....始化数据模块据结构的选择数组是存储数据的种典型而又简单可靠的数据结构,数组在进行查找,排序操作是很方便的,而且数组可以动态分配这方法又使数组的灵活性有所提高。数组般用在顺序存储中。顺序存储表示是将数据元素存放于个连续的存储空间,利用物理相邻来表示逻辑关系,实现顺序存取或按下标直接存取。它的存储效率高,存取速度快。但它的空间大小如果是静态分配的,经定义,在整个程序运行期间不会发生变化,因此,它不易扩充。同时,由于在插入或删除时,为保持原有顺序,平均需要移动半或近半元素,修改效率不高。链式存储表示的存储空间般在程序运行过程中动态分配和释放,且只要存储器中还有空间,就不会产生溢出的问题......”。
5、“.....只需要保持原有的逻辑顺序就行了,故不必移动元素,只需修改它们的链接指针,修改效率高。但在存取表中的数据元素时,只能循链顺序进行访问,且需要额外的指针,存储效率和访问效率低于顺序存储表示。而本次设计主要的数据处理都是顺序存储的,而且关联到很多的顺序对应运算,用数组进行数据存储是最优的选择。现给出本次设计中数据初始化中相关数组的定义,程序代码描述如下几个全局静态数组的定义均值初始化矩阵始化矩阵址存储字符串数组种算法的矩阵数据初始化均值算法矩阵数据初始化根据值聚类的算法描述,我们知道均值聚类算法中的影响因子有数据量大小,也就是址数目和用户目的大小和同问同次数,也就是访问频率两个方面......”。
6、“.....法所进么分类的标准主要是此否被问,有被访问则置,否则置其数据矩阵初始化的编程代码表示如图图据矩阵初始化代码址字符串数组数据初始化由于聚类的结果是要将分类后的示给用户,然而我们知道目很多,很难起显示给用户,或者说会使用户无法清晰地分析聚类的结果,所以我们先在显示出分类后的号,再显示出对应的具体的而我们需要对便要显示具体址时查找,调用和显示。其数据矩阵初始化的编程代码表示如图图储数组初始化代码均值算法的实现配个量到每个类中作为初始化类的平均量按照均值算法的描述,我们要事人为指定分类的个数,并随机地抽取其中的个向量做为每类的平均向量......”。
7、“.....所以这个向量便为个类的平均向量。在本次设计中并没有真正随机分配,而是将第,个分别作为第次初始化的各类的平均向量。在系统中的程序编码实现如图图均值初始化的各类的中心向量代码以上代码段中,变量表要进行分类的数,定义两个的字符串数组由于在后面的分类过程中需要循环地将向量分配到类中,在这个基础上要再次计算分配后的每个类的向量的平均值,就需要知道分配到每个类的的向量是哪几个,其中录的是变化后的各类中向量的序号,而录的是变化前各类中的向量的序号。同时这两个数组也是后面判断循环结束的条件因子之。环迭代分类过程给定每分类的初始向量后,我们就可以将向量进行筛选分配到每个类中,并且计算每个新类的平均向量......”。
8、“.....之而要进行新类与旧类的对比,若分类有更新说明聚类过程仍未结束,则继续循环迭代进行分类,直到分类结束。其中编程代码如图示图均值循环分类过程代码上面的程序段中包含两段代码用句话带过,具体的实现方式在下列进行说明进行次遍历,将配到各个相应的类中的代码段如图示图配到各个相应的类中的代码计算平均值向量的过程,从前面定义的字符串数组取出对应的第类中包含的向量对应的行号,将其取出,将类中包含的所有向量的对应元素值相加再除以个数算出分配后类的平均向量的每个元素值,从而得出分配后每个类的平均向量,为下次分配作准备,其编程代码实现如图图算分配后各类的平均向量类结果显示最后完成聚类,并进行结果显示,显示的结果如图示......”。
9、“.....只好进行再次显示,双击每条分类,则进行完全显示,在二次结果显示的窗口中单击详细址列表则进行对应的详细的址显示,其运行结果及界面如图示图均值运行结果显示窗口我们看到第三行中分类后含的数没能完全显示出来,双击此行则出现二次显示窗口,如图图均值二次显示窗口在二次查看窗口中,我们仍是只能看分类后,每个类中包含的对应编号,而未能查看具体的击详细表,则进行号和地址的详细显示,如图图均值具体示窗口类算法实现法描述如前所述,阵的行向量,反映了客户对本站点的不同页面的访问情况,如果客户对些页面的访问情况相同或相似,那么,这些页面理应为相关页面,可以聚为类。聚类时,同样先对联矩阵进行预处理......”。
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。