作业散列法实验研究.docx
《作业散列法实验研究.docx》由会员分享,可在线阅读,更多相关《作业散列法实验研究.docx(21页珍藏版)》请在第一文库网上搜索。
1、课程设计题目1 .具体要求散列法中,散列函数构造方法多种多样,同时对于同一散列函数解决冲突的方法也可以不同。两者是影响查询算法性能的关键因素。对于几种典型的散列函数构造方法,做实验观察,不同的解决冲突方法对查询性能的影响。2 .开发环境VC+6.03 .算法设计思想散列又称哈希或杂凑。散列法(HaShiIIg)在表项的存储位置与它的关键码之间建立一个确定的对应函数关系HaSh(),以使每个关键码与结构中的唯一存储位置相对应,该关系可用下式表示:Address=Hash(Record.key)相应的表称为哈希表,这种方法的基本思想是:首先在元素的关键字k和元素的存储位置P之间建立一个对应关系H,
2、使得p=H(k),H称为哈希函数。创建哈希表时,把关键字为k的元素直接存入地址为H(k)的单元;以后当查找关键字为k的元素时,再利用哈希函数计算出该元素的存储位置p=H(k),从而达到按关键字直接存取元素的目的。哈希函数是一个映象,哈希函数的设定灵活,只要使得任何关键字所得的哈希函数值都落在表长范围之内即可。当关键字集合很大时,关键字值不同的元素可能会映象到哈希表的同一地址上,即k1k2,但H(k1)=H(k2),这种现象称为冲突,此时称k1和k2为同义词。实际中,冲突是不可避免的,只能通过改进哈希函数的性能来减少冲突。综上所述,哈希法主要包括以下两方面的内容:(1)如何构造哈希函数;(2)如
3、何处理冲突。4 .数据结构与算法描述一、散列函数通常,构造散列函数应该注意的几个问题包括:首先,散列函数的定义域必须包括需要存储的全部关键码,而如果散列表允许有m个地址,其值域必须在1m-1之间;其次,散列函数计算出来的地址应能均匀分布在整个地址空间中;再次,散列函数应当是尽量简单的。(1)直接定址法直接定址法蓝颜元素关键码的某个线性函数值作为该元素的散列地址(散列地址,即元素最终在字典中的存储位置)。如下面的函数式:Hash(key)=akey+b式中,a,b为常数。采用该种方法,当向字典中加入某一新元素时算法自动调用此函数,以确定该元素最终的存储位置。若某元素关键码key为1,上式中,a=
4、2,b=3则该元素最终会存储在字典第5个位置中。直接定址法的优点是实现方法简单,算法时间复杂度较小,而且不会产生冲突。但是,直接定址法要求散列地址空间的大小与关键码集合的大小一致,而这种要求是苛刻的,一般彳艮难实现。例如当关键码的范围为1I(XXXMX)时,元素散列地址的个数也要达到IOOOOO0。这么大的散列地址是不合实际的。(2)除留余数法设散列表中允许的地址数为m,取一个不大于m,但最接近或等于m的质数K或选取一个不含有小于20的质因子的合数作为除数。利用下面的式子计算元素的散列地址的方法称为除留余数法。Hash(key)=key%k,km其中,是整数除余法取余的运算,要求这时的质数不是
5、接丘2的帛。例如,当元素的关键码key为2008,散列地址总数为50,这时取k=47,则散列地址为HaSh(2008)=2008%47=34,所以运算将停储在字典第47个位置中。除留余数法将有效缩减散列地址空间的大小,例如上例散列地址空间中只有50个有效的散列地址。除留余数法的缺点是极易发生冲突,如关键码为1914的元素经过上述教例函数计算后也招获得散列地址34。此时出现的两个不同元素争用同一存储地址的情况就称为冲突。(3)平方取中法平方取中法是一种常用的实现散列函数的方法。平方取中法是一种先放大再集合的构造方法,这种构造模式先通过求关键字的平方值扩大相近数的差别,然后根据表长度取中间的几位数
6、作为散列函数值,这种取中间数的方法是一种类随机方案,因此也可以认为平方取中法是一种产生伪随机数的方法。因为一个乘积的中间几位数和乘数的每一位都相关,所以有此产生的散列地址较为均匀。利用平方取中法实现散列函数的过程:首先,利用一定的编码规则把元素的关键码转换成标识符。然后,求出标识符的内码表示并计算内码的平方值。最后,取内码平方数的中间X位作为元素最终的散列地址。简而言之,即先计算构成关键码表示符的内码平方,然后按照散列表的大小取中间的若干位作为散列地址。在平方取中法中,地址空间内散列地址的数目一般为2的k次席,并在计算出内码平方的平方后,本即居k的大小决定最终散列地址的位数。例如某个地址空间中
7、散列地址的个数为128,则最终取内码平方中间7位作为元素最终的散列地址。(4)乘余取整法乘余取整法利用下面的式子计算元素的散列地址。Hash(key)=Z(akey%1)其中,a为一个常数且Oa1,Z为一个整数。式axkey%1表示axkey取小数部分,即akey%1=akey-akey。例如,当元素关铺码为2008,小数a为0.6180339,整数Z为IOoO0,则散列地址计算为HaSh(2008)=10000(0.61803392008%1)=120o乘余取整法不但会缩减散列地址空间的大小,还能极大减小冲突情况的发生几率。KnUth对锄a的取法做了仔细的研究,发现虽然a取任何值都可以,但一
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 作业 散列法 实验 研究