天天看点

十月百度,阿里巴巴,迅雷搜狗最新面试十一题

    当即早已进入10月份,十一过后,招聘,笔试,面试,求职渐趋火热。而在这一系列过程背后浮出的各大IT公司的笔试/面试题则蕴含着诸多思想与设计,细细把玩,思考一番亦能有不少收获。

    上个月,本博客着重整理九月腾讯,创新工场,淘宝等公司最新面试十三题,此次重点整理百度,阿里巴巴,迅雷和搜索等公司最新的面试题。同上篇一样,答案望诸君共同讨论之,个人亦在慢慢思考解答。多谢。

最新面试十一题

  1. 十月百度:一个数组保存了N个结构,每个结构保存了一个坐标,结构间的坐标都不相同,请问如何找到指定坐标的结构(除了遍历整个数组,是否有更好的办法)?
  2. 百度最新面试题:现在有1千万个随机数,随机数的范围在1到1亿之间。现在要求写出一种算法,将1到1亿之间没有在随机数中的数求出来。
  3. Alibaba笔试题:给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,请说明思路并编程实现方法

        String extractSummary(String description,String[] key words)

    目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出。(不限编程语言)20分。

  4. 搜狗:有N个正实数(注意是实数,大小升序排列) x1 , x2 ... xN,另有一个实数M。 需要选出若干个x,使这几个x的和与 M 最接近。 请描述实现算法,并指出算法复杂度。
  5. 迅雷:给你10台机器,每个机器2个cpu,2g内存,现在已知在10亿条记录的数据库里执行一次查询需要5秒,问用什么方法能让90%的查询能在100毫秒以内返回结果。
  6. 给定一个函数rand()能产生0到n-1之间的等概率随机数,问如何产生0到m-1之间等概率的随机数?
  7. 腾讯:五笔的编码范围是a ~ y的25个字母,从1位到4位的编码,如果我们把五笔的编码按字典序排序,形成一个数组如下:

        a, aa, aaa, aaaa, aaab, aaac, … …, b, ba, baa, baaa, baab, baac … …, yyyw, yyyx, yyyy

    其中a的Index为0,aa的Index为1,aaa的Index为2,以此类推。

    1)编写一个函数,输入是任意一个编码,比如baca,输出这个编码对应的Index;

    2)编写一个函数,输入是任意一个Index,比如12345,输出这个Index对应的编码。

  8. 2011.10.09百度笔试题(下述第8-12题):linux/unix远程登陆都用到了ssh服务,当网络出现错误时服务会中断,linux/unix端的程序会停止。为什么会这样?说下ssh的原理,解释中断的原理。
  9. 一个最小堆,也是完全二叉树,用按层遍历数组表示。

      1.  求节点a[n]的子节点的访问方式

      2.  插入一节点的程序void add_element(int *a,int size,int val);

      3.  删除最小节点的程序。

  10. a)求一个全排列函数:如p([1,2,3]) ,输出:  [123],[132],[213],[231],[321],[323]。

    b)求一个组合函数:    如p([1,2,3]) ,输出:[1],[2],[3],[1,2],[2,3],[1,3],[1,2,3]。

    这两问可以用伪代码(全排列请参考这里的第67题:微软、Google等公司非常好的面试题及解答[第61-70题] )。

  11. 十月百度,阿里巴巴,迅雷搜狗最新面试十一题
  12. 对一个数比如N=020,有一个和他位数相同,

    每一位上的数相加和相同的且是比N大的最小的数,

    如M=101,记M=f(N),s1=N,s=f(N),s3=f(s2)。

    求当N的位数小于1000,M的大小小于10^500的序列。

    example:

    N=134 , M=143,  // 1+3+4=1+4+3

    N=020, M = 101, //2=1+1

  13. 有1000万条URL,每条URL 50字节,只包含主机前缀,要求实现URL提示系统:

    (1)要求实时更新匹配用户输入的地址,每输出一个字符,输出最新匹配URL

    (2)每次只匹配主机前缀,例如对 www.abaidu.com和www.baidu.com,用户输入www.b时只提示www.baidu.com(3)每次提供10条匹配的URL

    (4)以用户需求为主。

  14. 海量记录,记录形式如下: TERMID URLNOCOUNT urlno1 urlno2   ..., urlnon  

    怎么考虑资源和时间这两个因素,实现快速查询任意两个记录的交集,并集等,设计相关的数据结构和算法。

  15. 百度最新笔试题(感谢xiongyangwan提供的题目):利用互斥量和条件变量设计一个消息队列,具有以下功能:

       1 创建消息队列(消息中所含的元素)

       2 消息队列中插入消息

       3 取出一个消息(阻塞方式)

       4 取出第一消息(非阻塞方式)

  16. 百度移动终端研发笔试:系统设计题(40分)

    对已排好序的数组A,一般来说可用二分查找可以很快找到。现有一特殊数组A[],它是循环递增的,如A[]={ 17 19 20 25 1 4 7 9},试在这样的数组中找一元素x,看看是否存在。

    请写出你的算法,必要时可写伪代码,并分析其空间、时间复杂度。

  17. #include<stdio.h>

    #include <string.h>

    void main()

    {

     int a[2000];

     char *p = (char *)a;

     int i ;

     for( i = 0; i < 2000; i++)

      a[i] = -i -1;

     printf("%d\n", strlen(p));

    }

    写出输出结果....

  18. 腾讯10.09测试笔试题:有N+2个数,N个数出现了偶数次,2个数出现了奇数次(这两个数不相等),问用O(1)的空间复杂度,找出这两个数,不需要知道具体位置,只需要知道这两个值。(@Rojay:xor一次,得到2个奇数次的数之和x。第二步,以x(展开成二进制)中有1的某位(假设第i位为1)作为划分,第二次只xor第i位为1的那些数,得到y。然后x xor y以及y便是那两个数。 )
  19. @well:一个整数数组,有n个整数,如何找其中m个数的和等于另外n-m个数的和?(博客之前曾有过类似的一题:第五章、寻找满足条件的两个或多个数)。
  20. 阿里云笔试题:一个HTTP服务器处理一次请求需要500毫秒,请问这个服务器如何每秒处理100个请求。
  21. 今天10.10阿里云笔试@土豆:死锁的条件。(互斥条件(Mutual exclusion):1、资源不能被共享,只能由一个进程使用。2、请求与保持条件(Hold and wait):已经得到资源的进程可以再次申请新的资源。3、非剥夺条件(No pre-emption):已经分配的资源不能从相应的进程中被强制地剥夺。4、循环等待条件(Circular wait):系统中若干进程组成环路,该环路中每个进程都在等待相邻进程正占用的资源。处理死锁的策略:1.忽略该问题。例如鸵鸟算法,该算法可以应用在极少发生死锁的的情况下。为什么叫鸵鸟算法呢,因为传说中鸵鸟看到危险就把头埋在地底下,可能鸵鸟觉得看不到危险也就没危险了吧。跟掩耳盗铃有点像。2.检测死锁并且恢复。3.仔细地对资源进行动态分配,以避免死锁。4.通过破除死锁四个必要条件之一,来防止死锁产生。)
  22. 微软2011最新面试题(以下三题,第22、23、24题皆摘自微软亚洲研究院的邹欣老师博客):浏览过本人的编程艺术系列的文章,一定对其中的这个问题颇有印象:第七章、求连续子数组的最大和。求数组最大子数组的和最初来源于编程之美,
    十月百度,阿里巴巴,迅雷搜狗最新面试十一题
    。我在编程艺术系列中提供了多种解答方式,然后这个问题若扩展到二维数组呢?再者,若数组首尾相连, 像一个轮胎一样, 又怎么办呢?如下图所示:
    十月百度,阿里巴巴,迅雷搜狗最新面试十一题
  23. 《编程之美》的第一题是让Windows 任务管理器的CPU 使用率曲线画出一个正弦波。我一直在想, 能不能把CPU 使用率边上的网络使用率也如法炮制一下呢?  比如, 也来一个正弦曲线?
    十月百度,阿里巴巴,迅雷搜狗最新面试十一题
  24. 如果你没看过, 也至少听说<人月神话>  (The Mythical Man-month) 这本在软件工程领域很有影响的书.  当你在微软学术搜索中输入 “manmonth” 这个词的时候, 你会意外地碰到下面这个错误:
    十月百度,阿里巴巴,迅雷搜狗最新面试十一题

    经过几次试验之后, 你发现必须要输入 “man-month” 才能得到希望的结果。 这不就是只差一个  ‘-’ 符号么?  为什么这个搜索引擎不能做得聪明一些, 给一些提示 (Query Suggestion)? 或者自动把用户想搜的结果展现出来 (Query Alteration)?   我们在输入比较长的英文单词的时候, 也难免会敲错一两个字母, 网站应该帮助用户, 而不是冷冰冰地拒绝用户啊。

    微软的学术搜索 (Microsoft Academic Search) 索引了超过 3千万的文献,  2 千万的人名, 怎么能以比较小的代价, 对经常出现的输入错误提供提示? 或直接显示相关结果, 避免用户反复尝试输入的烦恼?  

    你可能会说, 这很难吧,   但是另一家搜索引擎似乎轻易地解决了这个问题 (例子)。 所以, 还是有办法的。

    这个题目要求你:

     1) 试验不同的输入, 反推出目前微软的学术搜索是如何实现搜索建议 (Query Suggestion)的。

     2) 提出自己的改进建议,  并论证这个解决方案在千万级数据规模上能达到 “足够好” 的时间 (speed) 和空间 (memory usage)效率。

     3) 估计这事需要几个 人·月 (man-month) 才能做完?

    备注:顺便给邹欣老师传个话,如果应届毕业生可以全部做完上述三个题目,便可以直接找他。

  25. 更新至2011.10.10.....

    更多面试题,参见横空出世,席卷Csdn--评微软等数据结构+算法面试100题 (在此文中,集结了本博客已经整理的236道面试题)。

后记   

    此些面试题看多了,自然会发现题目类型可能会千变万化,但解决问题的思路却只有那么几种。再者,写代码的时候,很多的细节需要务必注意,如返回值,函数参数的检查,特殊情况的处理等等,这是一个代码规范性的问题。在结文之前,有三事须说明:

  1. 结构之法算法之道全部博文集锦第4期CHM文件下载:http://download.csdn.net/detail/v_JULY_v/3660710。
  2. 个人现在湖南,也正在找工作中。
  3. 本博客算法交流群第14群:Algorithms_14,179203802。

    ok,日后一有最新的面试题,再整理,有任何问题,欢迎在本文评论下指出或来信指导

继续阅读