3分彩app官方登入_为什么要重写hashcode和equals方法?初级程序员在面试中很少能说清楚。

  • 时间:
  • 浏览:0

     我在面试 Java初级开发的事先,老会 会问:你有没办法 重写过hashcode依据?不少候选人直接说没写过。你都前要想,或许真的没写过,于是就再通过有4个间题确认:你在用HashMap的事先,键(Key)每种,有没办法 放过自定义对象?而這個事先,候选人说放过,于是有4个间题的回答就自相矛盾了。

    最近问下来,這個间题普遍回答不大好,于是在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由自己们就自然清楚上述间题的答案了。

1 通过Hash算法来了解HashMap对象的高效性

    我们先复习数据内外部里的有4个知识点:在有4个长度为n(假设是500)的线性表(假设是ArrayList)里,存放着无序的数字;可能我们要找有4个指定的数字,就不得不通过从头到尾依次遍历来查找,那我的平均查找次数是n除以2(这里是500)。

我们再来观察Hash表(这里的Hash表纯粹是数据内外部上的概念,和Java无关)。它的平均查找次数接近于1,代价相当小,关键是在Hash表里,存装进去其中的数据和它的存储位置是用Hash函数关联的。

    我们假设有4个Hash函数是x*x%5。当然实际情况表里可能用没办法 简单的Hash函数,我们这里纯粹为了说明方便,而Hash表是有4个长度是11的线性表。可能我们要把6装进去其中,没办法 我们首先会对6用Hash函数计算一下,结果是1,回会我们就把6装进去到索引号是1這個位置。同样可能我们要放数字7,经过Hash函数计算,7的结果是4,没办法 它将被装进去索引是4的這個位置。這個效果如下图所示。

    那我做的好处非常明显。比如我们要从中找6這個元素,我们都前要先通过Hash函数计算6的索引位置,如可让直接从1号索引里找到它了。

不过我们会遇到“Hash值冲突”這個间题。比如经过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的处里方案。效果如下图所示。

 

    具体的做法是,为所有Hash值是i的对象建立有4个同义词链表。假设我们在装进去8的事先,发现4号位置可能被占,没办法 就会新建有4个链表结点装进去8。同样,可能我们要找8,没办法 发现4号索引里就有8,那会沿着链表依次查找。

    虽然我们还是无法彻底处里Hash值冲突的间题,如可让Hash函数设计合理,仍能保证同义词链表的长度被控制在有4个合理的范围里。这里讲的理论知识暂且无的放矢,我们能在后文里清晰地了解到重写hashCode依据的重要性。

2 为那些要重写equals和hashCode依据

    我们我们用HashMap存入自定义的类时,可能不重写這個自定义类的equals和hashCode依据,得到的结果会和我们预期的不一样。我们来看WithoutHashCode.java這個例子。

在其中的第2到第18行,我们定义了有4个Key类;在其中的第3行定义了唯一的有4个属性id。当前我们先注释掉第9行的equals依据和第16行的hashCode依据。    

1	import java.util.HashMap;
2	class Key {
3		private Integer id;
4		public Integer getId() 
5	{return id; }
6		public Key(Integer id) 
7	{this.id = id;	}
8	//故意先注释掉equals和hashCode依据
9	//	public boolean equals(Object o) {
10	//		if (o == null || !(o instanceof Key)) 
11	//		{ return false;	} 
12	//		else 
13	//		{ return this.getId().equals(((Key) o).getId());}
14	//	}
15		
16	//	public int hashCode() 
17	//	{ return id.hashCode();	}
18	}
19	
20	public class WithoutHashCode {
21		public static void main(String[] args) {
22			Key k1 = new Key(1);
23			Key k2 = new Key(1);
24			HashMap<Key,String> hm = new HashMap<Key,String>(); 
25			hm.put(k1, "Key with id is 1");		
26			System.out.println(hm.get(k2));		
27		}
28	}

    在main函数里的第22和23行,我们定义了有4个Key对象,它们的id就有1,就好比它们是两把相同的都能打开同一扇门的钥匙。

    在第24行里,我们通过泛型创建了有4个HashMap对象。它的键每种都前要存放Key类型的对象,值每种都前要存储String类型的对象。

    在第25行里,我们通过put依据把k1和一串字符装进去到hm里; 而在第26行,我们想用k2去从HashMap里得到值;这就好比我们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果就有我们想象中的那个字符串,回会 null。

    愿因有4个—没办法 重写。第一是没办法 重写hashCode依据,第二是没办法 重写equals依据。

   我们我们往HashMap里放k1时,首先会调用Key這個类的hashCode依据计算它的hash值,回会把k1装进去hash值所指引的内存位置。

    关键是我们没办法 在Key里定义hashCode依据。这里调用的仍是Object类的hashCode依据(所有的类就有Object的子类),而Object类的hashCode依据返回的hash值虽然是k1对象的内存地址(假设是50)。

    

    可能我们回会是调用hm.get(k1),没办法 我们会再次调用hashCode依据(还是返回k1的地址50),回会根据得到的hash值,能加快速度地找到k1。

    但我们这里的代码是hm.get(k2),我们我们调用Object类的hashCode依据(可能Key里没定义)计算k2的hash值时,虽然得到的是k2的内存地址(假设是50)。可能k1和k2是有4个不同的对象,回会它们的内存地址一定不需要相同,也回会 说它们的hash值一定不同,这回会 我们无法用k2的hash值去拿k1的愿因。

    我们我们把第16和17行的hashCode依据的注释再加后,会发现它是返回id属性的hashCode值,这里k1和k2的id就有1,回会它们的hash值是相等的。

    我们再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是50,把k1对象装进去到对应的位置。而取k2时,是先计算它的hash值(可能k2的id也是1,這個值也是50),回会到這個位置去找。

    但结果会出乎我们意料:明明50号位置可能有k1,但第26行的输出结果依然是null。其愿因回会 没办法 重写Key对象的equals依据。

    HashMap是用链地址法来处里冲突,也回会 说,在50号位置上,有可能指在着多个用链表形式存储的对象。它们通过hashCode依据返回的hash值就有50。

     我们我们通过k2的hashCode到50号位置查找时,虽然会得到k1。但k1有可能仅仅是和k2具有相同的hash值,但暂且和k2相等(k1和k2两把钥匙暂且能开同一扇门),這個事先,就前要调用Key对象的equals依据来判断两者是否是 相等了。

    可能我们在Key对象里没办法 定义equals依据,系统就不得不调用Object类的equals依据。可能Object的固有依据是根据有4个对象的内存地址来判断,回会k1和k2一定不需要相等,这回会 为那些依然在26行通过hm.get(k2)依然得到null的愿因。

    为了处里這個间题,我们前要打开第9到14行equals依据的注释。在這個依据里,只要有4个对象就有Key类型,如可让它们的id相等,它们就相等。

3 对面试间题的说明

    可能在项目里老会 会用到HashMap,回会我在面试的事先回会问這個间题∶你有没办法 重写过hashCode依据?你在使用HashMap时有没办法 重写hashCode和equals依据?你是为什么写的?

    根据问下来的结果,我发现初级应用程序员对這個知识点普遍没掌握好。重申一下,可能我们要在HashMap的“键”每种存放自定义的对象,一定要在這個对象里用自己的equals和hashCode依据来覆盖Object里的同名依据。 

     本文是从Java核心技术及面试指南这本书中相关内容改编而来。