1.大佬总结-七厂22场算法岗面经
作者:踏云逐梦
链接:https://www.nowcoder.com/discuss/98421
来源:牛客网
秋招提前批基本结束,前前后后面了7家公司22场技术面,全部流程都走完了,目前过4待定3,发波面经攒RP。
本人nlp方向无top水硕,总体来说,各个公司风格差别很大,但总的来说就是手撕算法,细扣简历项目及其涉及到的算法基础,给实际场景求解题思路三种。项目相关没啥参考性,这篇面经主要是算法题以及场景题
微软一面30min
手撕:一堆绳子,给定段数k,求最大的可能长度
微软二面30min
手撕:逆序对问题
英语自我介绍
中文讲项目
一开始没做出来,最后变成了写归并排序,然后才做出来
微软三面40min
手撕
环形有序链表插入元素
英语讲项目,项目中的最大困难,如何解决
给定股票价格图,初始资金,求最大收益
微软四面
某部门老大,
貌似是个大佬,全程项目
阿里一面 1.2h
现场
手撕:判断一个字符串是否能被分割成斐波拉契数列
项目
场景:给1w人数据集,判断一个新的名字是男是女(新名字不一定合法,如张凳子;新名字的字不一定出现在训练集中)
给淘宝相关数据,为女生节活动筛选出100个女生。
聊天
阿里二面 1h
部门老大,现场
全程白板讲项目,感觉不像面试,更像交流会
期间穿插具体工作中的问题,问我的思路:
商家买了“拖鞋”关键字广告,但拖鞋分很多种(室内、室外、男、女等),如何有针对的推荐
如何把不同维度的信息向量化,用以深度学习系统,如:商品描述,图片,用户信息,购买记录等等。
数据可视化怎么做
阿里3面 50min
详细梳理项目,细致到分析所用神经网络神经元中参数的维度。
关于论文研究,创新点在哪里,为什么这么做,如何运用到实际任务中。
项目中有的用了CNN,有的用了RNN,两者特征有什么区别,如何根据具体任务判定使用哪种网络结构
华为一面30min
全程项目
华为二面30min
全程项目
华为总裁面
聊天……
拼多多一面40min
手撕一个easy级别题目,接下来全项目
拼多多二面1.2h
手撕一个easy级别题目
深度学习中的过拟合,如何解决
梯度消失原因,解决方法,为什么LSTM可以避免梯度消失(数学层面分析)
BN公式,为什么work
头条一面
完全手撕代码
已知f(x)的定义域在正整数,值域在正整数,单调递增。
给定y,求t,使得 |f(t)-y| 最小
函数可能溢出,只保证出题有意义,那么,二分上界为多少
给数据流(大于内存上限),m,求从数据流中抽样m个样本。
头条二面
完全手撕代码
定义:
Double A[N]
Double ans=0;
For(i=0; i<n; i++)
For (j = 0; j<n; j++)
{
Ans += abs(A[i]-A[j]) (1)
Ans += floor(abs(A[i]-A[j])) (2)
}
优化算法至O(n^2)以下。1,2代表第一问和第二问
头条三面
项目介绍
你投的文章没中,为什么没中,怎么改进
手撕代码
给一个只包含‘(’ 和‘)’的字符串,求最长合法子串,要求用两种以上的O(n)算法求解。
腾讯一面 1h
算法:x的n次方 (最水版,越界检测,高精度计算什么的完全不需要)
四个项目,串在一起,讲一遍
腾讯2面 30min
项目
应用场景面:从一系列的用户行为特征中选出用于支撑推荐系统的重点行为
腾讯3面 30min
项目
项目中最大困难,如何解决,你在团队中的角色。
应用场景面:如何生成有吸引力的新闻标题
职业规划
腾讯4面 40min
项目
场景:同时出现多个球星名字的新闻在新闻分类中通常被分做体育类别,但是如果一条新闻内容是一群球星参加了某电影的发布会,简单将其归为体育类显然是不合适的,如何处理
腾讯和阿里的比较(送命题)
工作地意愿
百度1面 45min
手撕代码:
给定一个字符串,请找出最长无重复子串,要求输出子串和子串的长度
求解N以内的所有质数
简单简历面
Dropout的理解
百度2面 45min
手撕代码:
一系列有序数列,求出现次数topk的数
简单讲下项目
百度3面 1.5h
序列标注你知道多少
序列标注如何在没有上下文的情况下区分周杰伦-青花瓷 周杰-伦青花瓷(不能使用词库)
序列标注中,如何针对语音识别中的错误进行纠错
实体链接知道吗,你觉得可以使用什么类型的特征做
设计一个识别如“放《晴天》”这样的语音指令的模型
关系抽取模型如何针对特定领域进行优化
Joint train序列标注模型和关系抽取模型时,为什么不用CRF
你怎么看当团队需要你离开最熟悉的领域进行新方向的研究和开发
2.百度阿里图像算法岗面经
作者:明月千里寄相思2
链接:https://www.nowcoder.com/discuss/122670
来源:牛客网
一.百度面经
百度是转正面试,虽然是转正,但也不水。
1.一面
实习期间做的项目,具体到网络结构参数,损失函数怎么定义等等;
Linux常用指令,比如如何找到Python的进程并杀死;
git常用指令,遇到冲突怎么办;
resnet,mobilenet比较分析特点;
bn层详解,优点以及如何反向传播;
算法题:最长公共子序列;
开放题:图文匹配,训练模型如何采集数据,如果构建模型,以及hard case怎么收集?;
2.二面
如果bat都给你offer的话怎么选?;(肿么可能)
觉得技术的价值在哪里;
最优化里面的一些算法,牛顿法,共轭梯度法,拟牛顿;
3.经理面三面
最近感觉工作怎么样?压力大不大?
(因为楼主最近在做粗分类,所以)
粗分类要怎么做?最重要的是什么
还有一些和实习相关的问题~~
二.阿里(时间久远记不太清了)
1.一面(还比较正常)
cpp基本知识,内存分配,堆和栈哪个快,指针引用区别,虚函数;
目标检测算法rcnn系列到yolo等梳理一遍;
问ssd如果做道路上汽车的检测应该怎么改进比较合适;
堆排序;
关于排序的一个情景题(25个小车 速度未知,只有五个跑道,如何最快选出最快的五个车);
二面全程讲项目
三面蚂蚁面试官交叉面,讲项目
四面主管面:讲项目
HR面:还问了一些技术问题,然后就是正常HR面问题
3.百度-机器学习
作者:过把火
链接:https://www.nowcoder.com/discuss/121233
来源:牛客网
百度正常批,成都面经
一面:
一面遇到的面试官十分注重算法基本功,因此一口气被问了5道编程:
1、链表反转
2、二叉树后序遍历
3、TopK
4、IP地址 32位int存储
5、快排非递归
全部编程题需要手写,但是我当场提出了是否可以使用电脑的要求,面试官特别好说话,就同意了,只是全程会盯着我的电脑......然后让我写了测试用例,感觉自己挖了坑
6、项目介绍
二面:
一面结束相隔一天就被通知二面。
二面的面试官特别萌,态度超nice,穿着一身AJ,感觉打球很不错的样子。
1、编程题01:编辑距离
2、编程题02:01矩阵找出最大面积的由1组成的矩形(lintcode 510-hard),当时给了非最优的解法,回家后找了下答案,的确是没有想到。
3、论文01逼问:
1)数据集
2)创新点
3)ARMA、LSTM、CNN、convLSTM原理以及网络结构
4)论文中的网络结构,每层参数如何计算、feature map大小的计算方法。
5)特征工程如何做的,是否使用过可视化组件,怎么用的。
4、论文02逼问:
1)创新点
2)MapReduce资源消耗的预测模型怎么做的,公式推导一遍。
3)Hadoop优化相关问题
5、专利逼问:
1)Spark原理、与Hadoop对比
2)CheckPoint原理,spark中的ckp有什么特性
3)专利中的模型如何优化计算成本
4)为何使用了图论方法
6、比赛逼问:
1)特征工程
2)缺失数据填补方法
3)滑窗法具体怎么做的
4)上分最快的几个方式详细介绍一下
5)为何选用LSTM+xgb
6)怎样做的模型融合
7、推导softmax
8、详细比较sigmoid、relu、leaky-relu等激活函数
9、Batch Normal的原理以及作用
10、怎样理解机器学习和深度学习。
二面基本上是简历面试,论文较为被看重,详细问了很多建模方法以及实现细节,包括keras里面的一些代码问题,但是面试官超好,全程没有紧张的感觉。
三面:交叉面
三面通知邮件中没有写房间号,到了现场被告知是部门随机,感觉就是哪个部门看重你,就会在三面面你。
面试官的确是手百-feed流的主管,全程场景题。
1、性格介绍
2、优缺点介绍
3、为什么要去北京
4、场景题
线上的图片推荐因为实时性要求不同分为图文和图集,balabal介绍一通图集 图文的区别,抛出一个问题:如何改善图集推荐时的bad case,要求给出各个模块的实现思路以及建模方法。
当被问到推荐系统相关问题时我是懵逼的,因为从没做过推荐,全程脑子里在搜索以前在天池看过的直播课,然后给出了一套设计方案。
面试官围绕我给出的方案一步步进行讨论和引导,差不多讨论了半小时。
给我的感觉就是,面试官并不会否定你的方案,而是围绕你给的方法一步步给予引导和改进,然后形成一套可实施的方案,在这过程中可能面试官看重的是你思考的过程以及一步步改进的意识。
5、介绍一下NLP的项目,图谱如何构建的,NER的效果如何。
交叉面的面试官真的是一个好的mentor,一个推荐方案从粗糙到细化,一步步给予引导,基本上自己没接触过,这30分钟至少搞清楚了图文、图集推荐的套路是怎样的,真的是受益匪浅。
四. HR:
26号收到面试通过的通知,要求27现场面签,因为学校三方的原因以及头条那边还没沟通薪资的原因,没有立即签约百度,HR也特别好,给了一定时间的宽限。
说实话,feed流算是百度核心部门,所以现在陷入纠结中......
五. 总结
百度的面试体验超好,没有刁难,没有超纲的问题,面试官只在乎你懂得东西懂得有多深,而不会触碰你简历上没有的东西,尤其是三面的mentor,真的超赞。
文章浏览阅读1k次。通过使用ajax方法跨域请求是浏览器所不允许的,浏览器出于安全考虑是禁止的。警告信息如下:不过jQuery对跨域问题也有解决方案,使用jsonp的方式解决,方法如下:$.ajax({ async:false, url: 'http://www.mysite.com/demo.do', // 跨域URL ty..._nginx不停的xhr
文章浏览阅读2k次。关于在 Oracle 中配置 extproc 以访问 ST_Geometry,也就是我们所说的 使用空间SQL 的方法,官方文档链接如下。http://desktop.arcgis.com/zh-cn/arcmap/latest/manage-data/gdbs-in-oracle/configure-oracle-extproc.htm其实简单总结一下,主要就分为以下几个步骤。..._extproc
文章浏览阅读1.5w次。linux下没有上面的两个函数,需要使用函数 mbstowcs和wcstombsmbstowcs将多字节编码转换为宽字节编码wcstombs将宽字节编码转换为多字节编码这两个函数,转换过程中受到系统编码类型的影响,需要通过设置来设定转换前和转换后的编码类型。通过函数setlocale进行系统编码的设置。linux下输入命名locale -a查看系统支持的编码_linux c++ gbk->utf8
文章浏览阅读750次。今天准备从生产库向测试库进行数据导入,结果在imp导入的时候遇到“ IMP-00009:导出文件异常结束” 错误,google一下,发现可能有如下原因导致imp的数据太大,没有写buffer和commit两个数据库字符集不同从低版本exp的dmp文件,向高版本imp导出的dmp文件出错传输dmp文件时,文件损坏解决办法:imp时指定..._imp-00009导出文件异常结束
文章浏览阅读143次。当下是一个大数据的时代,各个行业都离不开数据的支持。因此,网络爬虫就应运而生。网络爬虫当下最为火热的是Python,Python开发爬虫相对简单,而且功能库相当完善,力压众多开发语言。本次教程我们爬取前程无忧的招聘信息来分析Python程序员需要掌握那些编程技术。首先在谷歌浏览器打开前程无忧的首页,按F12打开浏览器的开发者工具。浏览器开发者工具是用于捕捉网站的请求信息,通过分析请求信息可以了解请..._初级python程序员能力要求
文章浏览阅读7.6k次,点赞2次,收藏6次。@Service标注的bean,类名:ABDemoService查看源码后发现,原来是经过一个特殊处理:当类的名字是以两个或以上的大写字母开头的话,bean的名字会与类名保持一致public class AnnotationBeanNameGenerator implements BeanNameGenerator { private static final String C..._@service beanname
文章浏览阅读6.9w次,点赞73次,收藏463次。1.前序创建#include<stdio.h>#include<string.h>#include<stdlib.h>#include<malloc.h>#include<iostream>#include<stack>#include<queue>using namespace std;typed_二叉树的建立
文章浏览阅读7.1k次。在Asp.net上使用Excel导出功能,如果文件名出现中文,便会以乱码视之。 解决方法: fileName = HttpUtility.UrlEncode(fileName, System.Text.Encoding.UTF8);_asp.net utf8 导出中文字符乱码
文章浏览阅读2.1k次,点赞4次,收藏23次。第一次实验 词法分析实验报告设计思想词法分析的主要任务是根据文法的词汇表以及对应约定的编码进行一定的识别,找出文件中所有的合法的单词,并给出一定的信息作为最后的结果,用于后续语法分析程序的使用;本实验针对 PL/0 语言 的文法、词汇表编写一个词法分析程序,对于每个单词根据词汇表输出: (单词种类, 单词的值) 二元对。词汇表:种别编码单词符号助记符0beginb..._对pl/0作以下修改扩充。增加单词
文章浏览阅读773次。我在使用adb.exe时遇到了麻烦.我想使用与bash相同的adb.exe shell提示符,所以我决定更改默认的bash二进制文件(当然二进制文件是交叉编译的,一切都很完美)更改bash二进制文件遵循以下顺序> adb remount> adb push bash / system / bin /> adb shell> cd / system / bin> chm..._adb shell mv 权限
文章浏览阅读6.8k次,点赞12次,收藏125次。1. 单目相机标定引言相机标定已经研究多年,标定的算法可以分为基于摄影测量的标定和自标定。其中,应用最为广泛的还是张正友标定法。这是一种简单灵活、高鲁棒性、低成本的相机标定算法。仅需要一台相机和一块平面标定板构建相机标定系统,在标定过程中,相机拍摄多个角度下(至少两个角度,推荐10~20个角度)的标定板图像(相机和标定板都可以移动),即可对相机的内外参数进行标定。下面介绍张氏标定法(以下也这么称呼)的原理。原理相机模型和单应矩阵相机标定,就是对相机的内外参数进行计算的过程,从而得到物体到图像的投影_相机-投影仪标定
文章浏览阅读2.2k次。文章目录Wayland 架构Wayland 渲染Wayland的 硬件支持简 述: 翻译一篇关于和 wayland 有关的技术文章, 其英文标题为Wayland Architecture .Wayland 架构若是想要更好的理解 Wayland 架构及其与 X (X11 or X Window System) 结构;一种很好的方法是将事件从输入设备就开始跟踪, 查看期间所有的屏幕上出现的变化。这就是我们现在对 X 的理解。 内核是从一个输入设备中获取一个事件,并通过 evdev 输入_wayland