条件的工作信息,并根据每条记录的各个属性与用户个人属性的相近度计算出每条记录的,并根据这个对结果进行排序显示。这模块的工作流程如下用户登陆成功之后,页面会将用户的等信息传给的实例,根据用户的性别职位语言信息发布时间所在地教育水平工作经验等数据粗略地选择出符合用户需求的工作信息记录。之后,对每条被选出的记录,根据其工资情况发布日期长短教育水平要求工作经验要求,计算每条记录与用户个人情况的符合度。根据这些记录的符合度进行排序,将排序后的结果返回给页面,并在页面中显示出来。以上这用户登录获得参数验证信息粗略提取工作信息计算各条记录的符合度排序记录集获取记录集显示结果显示信息数据库正确个处理排序结果的模型可以抽象为如下数学模型设集合为粗略选择得到的工作记录集合,集合是个以若干规则作为元素的集合。,于通过程序自动翻页却无法解决,因为般情况下,这些翻页是用些实现,而有的函数是动态生成的,有些是函数内又调用了些端不可见的函数,因此通过几乎无法实现翻页。而且,我们在这篇年的论文的中也看到了可以看出这可能是个比较难的问题。目前我们先绕过这个问题,通过其他途径进行数据抓取。第二种方法实现起来比较方便,首先我们分析几个目标网站的动态网页参数的分布范围,比如就代表个有效的网页,通过分析,发现参数的分布规律不是连续分布,然后对循环抓取。这当然会有效率低的问题,因为会有些无效网页或空网页被抓下来了,我们计划在后续加入个自动判断是是空网页的方法,其实也比较简单,在抓取的过程中,统计抓取到的网页的长度,如果抓取到定数量后,发现个长度的网页出现很多次,我们就能判定该长度的网页是空网页,有点学习的味道,之后就只需要丢弃抓到的该长度的网页,这样做的原因是使程序可以适用于多个网站而不用修改程序。信息提取模块由于数据抓取模块抓到的网页所包含的职位信息是非结构化或者半结构化的,因此需要个模块将这些信息转化为结构化信息。而个通用的信息提取系统可以在非结构化文本中提取我们所关心的信息,包括提取单个实体提取实体二元关系提取事件模板多元语义关系结构等阶段,涉及到比较深入的自然语言处理技术,是个值得深入研究的问题。由于本身是个很有技术难度,而且是当前个研究的热点。作为课程实习,我们将问题的范围做了限制,使我们的工作容易做些。因此我们关注于些半结构化系统设计使用了三个数据库表这些表的详细设计如下表存储了注册用户的信息字段名类型长度含义备注,唯标识不能为空,自增长,主键用户名用户姓名密码性别出生日期领域职位职务城市语言专业教育北京学历工作经历薪水要求地址邮编电子邮件电话职位类型主页表存储了网上的职位信息字段名类型长度含义备注,唯标识不能为空,自增长,主键公司名称,比如微软中国总公司公司介绍是段文本,由于比较长,可能是几百字,所以存成类型职位名称比如售前网络工程师职位发布日期比如职位介绍是段文本,可能是几百字,所以存成类型职位需求是段文本,可能是几百字,所以存成类型工作地点比如北京市招聘人数比如若干,性别要求比如长度含义备注,点击的用户标识联合主键,点击的职位标识点击日期点击次数网页文本分类模块网络文本分类模块使用了中科院计算所分类算法的源码,并且,然后在此基础上进行了调试修改,并进行了训练。这个分类器同时包含和两种分类器,经过测试发现分类器的分类效果明显的好与分类器,因此在接下来的工作中我们采用分类器。分类器源代码并不能直接编译通过,首先找到它所需要的库的头文件和文件,使得分类器的源代码能够在下顺利编译通过。然后进行的修改工作主要是加入数据库访问的功能,使平台的分类器能够对平台的数据库进行访问,能够查询出待分类的记录的信息,进行文本分类,然后修改记录类别。训练的过程我们人工建立了关于职位分类的训练集,训练的数据来源于我们所抓取的,等网站,每类找了多个典型网页个不等,提取其中关于职位描述的文本,这样就得到了训练集。然后利用训练集对采用的分类器进行训练。最后,找了包含每类中的职位信息文本作为测试集,对分类器和训练结果进行测试,分类效果还是不错的测试中分错类的很少。我们建立的分类类别主要是职位类型,包括以下类别硬件开发软件开发,的含义见上。中元素均具有系列相同的属性,设这些属性组成的集合为。,,在计算最终得分时,这些属性对应的权重为,对于中任意元素,对应于每个属性都将有个取值,该值对应着中该元素在这个属性上的得分。即,其中为属性的标号,而为第个属性在取值为这条记录中的值的时候的得分。于是,对于中任意元素,有,,最后,根据中各元素的值排序,并返回排序后的记录集。浏览全部工作信息模块考虑到有可能匹配到的工作信息比较少,用户有可能会有更进步的需求,这时就可以利用浏览全部工作信息这模块查看数据库中所爬取到的近个月内的所有工作。这功能模块实现比较简单,就是将数据库中所有工作信息取出,按时间排序,返回给页面显示出来即可。按类别浏览工作信息模块添加了分类模块之后,使得领域内的用户可以浏览本领域的所有工作信息。这功能是在浏览全部工作信息功能的基础上附加个条件而实现,类似于浏览全部工作信息模块。网络及通讯管理销售技术服务及客服市场公关广告财务审计统计金融保险生产制造工程人力资源行政后勤物流贸易采购文字艺术设计科研人员律师法务教师医疗护理咨询顾问公务员在校学生建筑房地产翻译其他以上工作为了保证系统效率,都是离线进行的。用户注册模块这模块功能比较简单,仅仅包含两三个页面,由用户输入相关个人信息,注册成为的会员,从而可以使用提供的功能服务。但是这模块却具有相当大的重要性。因为,后面的工作信息搜索就是在用户注册时所填写的个人信息基础上进行。根据实际在上搜索查看工作信息的经验,用户必须填写如下个人信息,才能正常使用所提供的功能用户名真实姓名密码性别生日即年龄领域职位所在地语言专业教育水平工作经验工资水平地址邮政编码电话以及工作类型。搜索工作信息模块本模块为前端核心模块。主要功能是根据用户注册时所填写的个人信息,从数据库工作信息中查找出符合用户男,穴的尺寸宜稍大于主流道大端的直径,长度约为主流道大端直径。浇口浇口是连接分流道与型腔的段细短的通道,它是浇注系统的关键部分,浇口的形状,数量,尺寸和位置对塑件的质量影响很大,浇口的主要作用有两个,是塑料熔体流经的通道,二是浇口的适时凝固可控制保压时间。浇口的类型有很多,有点浇口,侧浇口,直接浇口,潜伏式浇口等,各浇口的应用和尺寸按塑件的形状和尺寸而定,该模具采用侧浇口,其有以下特性形状简单,去除浇口方便,便于加工,而且尺寸精度容易保证试模时如发现不当,容易及时修改能相对独立地控制填充速度及封闭时间④对于壳体形塑件,流动充填效果较佳。设计导柱和导套需要注意的事项有合理布置导柱的位置,导柱中心至模具外缘至少应有个导柱直径的厚度导柱不应设在矩形模具四角的危险断面上。通常设在长边离中心线的处最为安全。导柱布置方式常采用等径不对称布置,或不等直径对称布置。导柱工作部分长度应比型芯端面高出,以确保其导向与引导作用。主流道拉料杆顶尖圆角导柱工作部分的配合精度采用,低精度时可采取更低的配合要求导柱固定部分配合精度采用导套外径的配合精度采取。配合长度通常取配合直径的倍,其余部分可以扩孔,以减小摩擦,降低加工难度。导柱可以设置在动模或定模,设在动模边可以保护型芯不受损坏,设在定模边有利于塑件脱模。成型零件工作尺寸的计算成型零件的工作尺寸是指凹模和凸模直接构成塑件的尺寸。凹凸模工作尺寸的精度直接影响塑件的精度。该塑件有需要配合的地方,所以对尺寸的要求比较高,但由于该塑件不是规则的圆柱形,其基本线条是由段圆弧组成,如图所示忽略顶尖圆角的影响,现在只考虑剩余的段圆弧,因为是对称结构,所以只要保证其中半的精度尺寸就可以保证整个塑件在配合处的尺寸即近似的把塑件当成两个规则圆柱形的组合体。成型零件工作尺寸计算方法般有两种种是平均值法,即按平均收缩率平均制造公差和平均磨损量进行计算另种是按极限收缩率极限制造公差和磨损量进行计算前种方法简便,但不适合精密塑件的模具设计,后种复杂,但能较好的保证尺寸精度。本设计采用平均值法。排气设计在塑料熔体填充注射模腔过程中,模腔内除了原有的空气外,还有塑料含有的水分在注射温度下蒸发而形成的水蒸汽,塑料局部分解产生的低分子挥发气体,塑料助剂挥发或化学反应所产生的气体以及热固性塑料交联硬化释放的气体等这些气体如果不能被熔融塑料顺利地排出模腔,将在制件上形成气孔,接缝,表面轮廓不清,不能完全充满型腔,同时,还会因为气体被压缩而产生的高温灼伤制件,使之产生焦痕,色泽不佳等缺陷。模具的排气可以利用排气槽排气,分型面排气,利用型芯,推杆,镶件等的间隙排气。料推荐的排气槽深度为。排气设计原则通常,选择排气槽的开设位置时,应遵循以下原则排气口不能正对操作者,以防熔料喷出而发生工伤事故最好开设在分型面上,如果产生飞边易随塑件脱出最好设在凹模上,以便于模具加工和清模方便开设在塑料熔体最后才能填充的模腔部位,如流道或冷料穴的终端开设在靠近嵌件和制件壁最薄处,因为这样的部位条件的工作信息,并根据每条记录的各个属性与用户个人属性的相近度计算出每条记录的,并根据这个对结果进行排序显示。这模块的工作流程如下用户登陆成功之后,页面会将用户的等信息传给的实例,根据用户的性别职位语言信息发布时间所在地教育水平工作经验等数据粗略地选择出符合用户需求的工作信息记录。之后,对每条被选出的记录,根据其工资情况发布日期长短教育水平要求工作经验要求,计算每条记录与用户个人情况的符合度。根据这些记录的符合度进行排序,将排序后的结果返回给页面,并在页面中显示出来。以上这用户登录获得参数验证信息粗略提取工作信息计算各条记录的符合度排序记录集获取记录集显示结果显示信息数据库正确个处理排序结果的模型可以抽象为如下数学模型设集合为粗略选择得到的工作记录集合,集合是个以若干规则作为元素的集合。,于通过程序自动翻页却无法解决,因为般情况下,这些翻页是用些实现,而有的函数是动态生成的,有些是函数内又调用了些端不可见的函数,因此通过几乎无法实现翻页。而且,我们在这篇年的论文的中也看到了可以看出这可能是个比较难的问题。目前我们先绕过这个问题,通过其他途径进行数据抓取。第二种方法实现起来比较方便,首先我们分析几个目标网站的动态网页参数的分布范围,比如就代表个有效的网页,通过分析,发现参数的分布规律不是连续分布,然后对循环抓取。这当然会有效率低的问题,因为会有些无效网页或空网页被抓下来了,我们计划在后续加入个自动判断是是空网页的方法,其实也比较简单,在抓取的过程中,统计抓取到的网页的长度,如果抓取到定数量后,发现个长度的网页出现很多次,我们就能判定该长度的网页是空网页,有点学习的味道,之后就只需要丢弃抓到的该长度的网页,这样做的原因是使程序可以适用于多个网站而不用修改程序。信息提取模块由于数据抓取模块抓到的网页所包含的职位信息是非结构化或者半结构化的,因此需要个模块将这些信息转化为结构化信息。而个通用的信息提取系统可以在非结构化文本中提取我们所关心的信息,包括提取单个实体提取实体二元关系提取事件模板多元语义关系结构等阶段,涉及到比较深入的自然语言处理技术,是个值得深入研究的问题。由于本身是个很有技术难度,而且是当前个研究的热点。作为课程实习,我们将问题的范围做了限制,使我们的工作容易做些。因此我们关注于些半结构化系统设计使用了三个数据库表这些表的详细设计如下表存储了注册用户的信息字段名类型长度含义备注,唯标识不能为空,自增长,主键用户名用户姓名密码性别出生日期领域职位职务城市语言专业教育北京学历工作经历薪水要求地址邮编电子邮件电话职位类型主页表存储了网上的职位信息字段名类型长度含义备注,唯标识不能为空,自增长,主键公司名称,比如微软中国总公司公司介绍是段文本,由于比较长,可能是几百字,所以存成类型职位名称比如售前网络工程师职位发布日期比如职位介绍是段文本,可能是几百字,所以存成类型职位需求是段文本,可能是几百字,所以存成类型工作地点比如北京市招聘人数比如若干,性别要求比如
温馨提示:手指轻点页面,可唤醒全屏阅读模式,左右滑动可以翻页。
第 1 页 / 共 38 页
第 2 页 / 共 38 页
第 3 页 / 共 38 页
第 4 页 / 共 38 页
第 5 页 / 共 38 页
第 6 页 / 共 38 页
第 7 页 / 共 38 页
第 8 页 / 共 38 页
第 9 页 / 共 38 页
第 10 页 / 共 38 页
第 11 页 / 共 38 页
第 12 页 / 共 38 页
第 13 页 / 共 38 页
第 14 页 / 共 38 页
第 15 页 / 共 38 页
预览结束,还剩
23 页未读
阅读全文需用电脑访问
1、手机端页面文档仅支持阅读 15 页,超过 15 页的文档需使用电脑才能全文阅读。
2、下载的内容跟在线预览是一致的,下载后除PDF外均可任意编辑、修改。
3、所有文档均不包含其他附件,文中所提的附件、附录,在线看不到的下载也不会有。
1、该文档不包含其他附件(如表格、图纸),本站只保证下载后内容跟在线阅读一样,不确保内容完整性,请务必认真阅读。
2、有的文档阅读时显示本站(www.woc88.com)水印的,下载后是没有本站水印的(仅在线阅读显示),请放心下载。
3、除PDF格式下载后需转换成word才能编辑,其他下载后均可以随意编辑、修改、打印。
4、有的标题标有”最新”、多篇,实质内容并不相符,下载内容以在线阅读为准,请认真阅读全文再下载。
5、该文档为会员上传,下载所得收益全部归上传者所有,若您对文档版权有异议,可联系客服认领,既往收入全部归您。