最近参加了一次面试,虽无笔试环节,几位考官却都在算法和思路题上大作文章,颇为受益
有这么几个问题印象深刻:
- 自创数据结构存储一些字符串,如何快速匹配用户输入(包含或者相等)?
- 若干memcached分布式的组成集群,有什么办法均匀的分布存储?
- 爬虫的排重怎么快又省(布隆过滤器原理)?
这几个问题都涉及到了哈希函数,这位编程人民的老朋友。
哈希函数,是一个能将任意大小数据映射到固定尺寸表示法的函数。个人理解,就是数据特征码提取的算法。哈希函数能做什么?在实践中,我用它将看起来很像却不同的两个数据,变成不同的表示码,以区别,以查找。[……]