个人公众号 yk 坤帝
后台回复 项目五 获取整理资源
1.有一个jsonline格式的文件file.txt大小约为10K
2.补充缺失的代码
3.输入日期 , 判断这一天是这一年的第几天?
4.打乱一个排好序的list对象alist?
5.现有字典 d= {‘a’:24,‘g’:52,‘i’:12,‘k’:33}请按value值进行排序?
6.字典推导式
7.请反转字符串 “aStr ”?
8.将字符串 “k:1 |k1:2|k2:3|k3:4”,处理成字典 {k:1,k1:2,…}
9.请按alist中元素的age由大到小排序
10.下面代码的输出结果将是什么?
11.写一个列表生成式,产生一个公差为11的等差数列
12.给定两个列表 ,怎么找出他们相同的元素和不同的元素?
13.请写出一段python代码实现删除list里面的重复元素?
14.给定两个list A ,B ,请用找出A,B中相同与不同的元素 企业面试题
15.python新式类和经典类的区别?
16.python中内置的数据结构有几种?
17.python如何实现单例模式?请写出两种实现方式?
18.反转一个整数,例如-123 --> -321
19.设计实现遍历目录与子目录 ,抓取.pyc文件
20.一行代码实现1-100之和
21.Python-遍历列表时删除元素的正确做法
22.字符串的操作题目
23.可变类型和不可变类型
24.is和==有什么区别?
25.求出列表所有奇数并构造新列表
26.用一行python代码写出1+2+3+10248
27.Python中变量的作用域?(变量查找顺序)
28.字符串 “123” 转换成 123 ,不使用内置api,例如 int()
29.Given an array of integers
30.python代码实现删除一个list里面的重复元素
31.统计一个文本中单词频次最高的10个单词?
32.请写出一个函数满足以下条件
33.使用单一的列表生成式来产生一个新的列表
34.用一行代码生成[1,4,9,16,25,36,49,64,81,100]
35.输入某年某月某日 ,判断这一天是这一年的第几天?
36.两个有序列表,l1,l2,对这两个列表进行合并不可使用extend
37.给定一个任意长度数组 ,实现一个函数
38.写一个函数找出一个整数数组中,第二大的数
39.阅读一下代码他们的输出结果是什么?
40.统计一段字符串中字符出现的次数
41.super函数的具体用法和场景
42.Python中类方法 、类实例方法、静态方法有何区别?
43.遍历一个object的所有属性,并print每一个属性名?
44.写一个类 ,并让它尽可能多的支持操作符?
45.介绍Cython,Pypy Cpython Numba各有什么缺点
46.请描述抽象类和接口类的区别和联系
47.Python中如何动态获取和设置对象的属性?
48.哪些操作会导致Python内存溢出,怎么处理?
49.关于Python内存管理,下列说法错误的是 B
50.Python的内存管理机制及调优手段?
51.内存泄露是什么?如何避免?
52.python常见的列表推导式?
53.简述read、readline 、readlines的区别?
54.什么是Hash(散列函数)?
55.python函数重载机制?
56.写一个函数找出一个整数数组中 ,第二大的数
57.手写一个判断时间的装饰器
58.使用Python内置的filter()方法来过滤?
59.编写函数的4个原则
60.函数调用参数的传递方式是值传递还是引用传递?
61.如何在function里面设置一个全局变量
62.对缺省参数的理解 ?
63.Mysql怎么限制IP访问?
64.带参数的装饰器?
65.为什么函数名字可以当做参数用?
66.Python中pass语句的作用是什么?
67.有这样一段代码 ,print c会输出什么,为什么?
68.交换两个变量的值?
69.map函数和reduce函数?
70.回调函数,如何通信的?
71.Python主要的内置数据类型都有哪些? print dir( ‘a ’) 的输出?
72.map(lambda x:xx ,[y for y in range(3)])的输出?
73.hasattr() getattr() setattr() 函数使用详解?
74.一句话解决阶乘函数?
75.什么是lambda函数? 有什么好处?
76.递归函数停止的条件?
77.下面这段代码的输出结果将是什么?请解释 。
78.什么是lambda函数?它有什么好处?写一个匿名函数求两个数的和
79.对设计模式的理解,简述你了解的设计模式?
80.请手写一个单例
81.单例模式的应用场景有那些?
82.用一行代码生成[1,4,9,16,25,36,49,64,81,100]
83.对装饰器的理解,并写出一个计时器记录方法执行性能的装饰器?
84.解释以下什么是闭包?
85.函数装饰器有什么作用?
86.生成器 ,迭代器的区别?
87.X是什么类型?
88.请用一行代码 实现将1-N 的整数列表以3为单位分组
89.Python中yield的用法?
90.Python中的可变对象和不可变对象?
91.Python的魔法方法
92.面向对象中怎么实现只读属性?
93.谈谈你对面向对象的理解?
94.请写出一段代码用正则匹配出ip?
95.a = “abbbccc ”,用正则匹配为abccc,不管有多少b,就出现一次?
96.Python字符串查找和替换?
97.用Python匹配HTML g tag的时候 ,<.> 和 <.*?> 有什么区别
98.正则表达式贪婪与非贪婪模式的区别?
99.写出开头匹配字母和下划线,末尾是数字的正则表达式?
100.正则表达式操作
101.请匹配出变量A 中的json字符串。
102.怎么过滤评论中的表情?
103.简述Python里面search和match的区别
104.请写出匹配ip的Python正则表达式
105.Python里match与search的区别?
106.进程总结
107.谈谈你对多进程,多线程 ,以及协程的理解,项目是否用?
108.Python异常使用场景有那些?
109.多线程共同操作同一个数据互斥锁同步?
110.什么是多线程竞争?
111.请介绍一下Python的线程同步?
112.解释以下什么是锁,有哪几种锁?
113.什么是死锁?
114.多线程交互访问数据 ,如果访问到了就不访问了?
115.什么是线程安全 ,什么是互斥锁?
116.说说下面几个概念:同步,异步,阻塞 ,非阻塞?
117.什么是僵尸进程和孤儿进程?怎么避免僵尸进程?
118.python中进程与线程的使用场景?
119.线程是并发还是并行,进程是并发还是并行?
120.并行(parallel)和并发(concurrency)?
121.IO密集型和CPU密集型区别?
122.python asyncio的原理?
123.怎么实现强行关闭客户端和服务器之间的连接?
124.简述TCP和UDP的区别以及优缺点?
125.简述浏览器通过WSGI请求动态资源的过程?
126.描述用浏览器访问www.baidu.com的过程
127.Post和Get请求的区别?
128.cookie 和session 的区别?
129.列出你知道的HTTP协议的状态码,说出表示什么意思?
130.请简单说一下三次握手和四次挥手?
131.说一下什么是tcp的2MSL?
132.为什么客户端在TIME-WAIT状态必须等待2MSL的时间?
133.说说HTTP和HTTPS区别?
134.谈一下HTTP协议以及协议头部中表示数据类型的字段?
135.HTTP请求方法都有什么?
136.使用Socket套接字需要传入哪些参数 ?
137.HTTP常见请求头?
138.七层模型?
139.url的形式?
140.对Flask蓝图(Blueprint)的理解?
141.Flask 和 Django 路由映射的区别?
142.什么是wsgi,uwsgi,uWSGI?
143.Django 、Flask、Tornado的对比?
144.CORS 和 CSRF的区别?
145.Session,Cookie,JWT的理解
146.简述Django请求生命周期
147.用的restframework完成api发送时间时区
148.nginx,tomcat,apach到都是什么?
149.请给出你熟悉关系数据库范式有哪些 ,有什么作用?
150.简述QQ登陆过程
151.post 和 get的区别?
152.项目中日志的作用
153.django中间件的使用?
154.谈一下你对uWSGI和nginx的理解?
155.Python中三大框架各自的应用场景?
156.Django中哪里用到了线程?哪里用到了协程?哪里用到了进程?
157.有用过Django REST framework吗?
158.对cookies与session的了解?他们能单独用吗?
159.试列出至少三种目前流行的大型数据库
160.列举您使用过的Python网络爬虫所用到的网络数据包?
161.爬取数据后使用
哪个数据库存储数据的,为什么? 162.你用过的爬虫框架或者模块有哪些?优缺点?
163.写爬虫是用多进程好?还是多线程好?
164.常见的反爬虫和应对方法?
165.解析网页的解析器使用最多的是哪几个?
166.需要登录的网页,如何解决同时限制ip ,cookie,session
167.验证码的解决?
168.使用最多的数据库,对他们的理解?
169.
编写过哪些爬虫中间件? 170.“极验 ”滑动验证码如何破解?
171.爬虫多久爬一次,爬下来的数据是怎么存储?
172.cookie过期的处理问题?
173.动态加载又对及时性要求很高怎么处理?
174.HTTPS有什么优点和缺点?
175.HTTPS是如何实现安全传输数据的?
176.TTL ,MSL,RTT各是什么?
177.谈一谈你对Selenium和PhantomJS了解
178.平常怎么使用代理的 ?
179.存放在数据库(redis、mysql等)。
180.怎么监控爬虫的状态?
181.描述下scrapy框架运行的机制?
182.谈谈你对Scrapy的理解?
183.怎么样让 scrapy 框架发送一个 post 请求(具体写出来)
184.怎么监控爬虫的状态 ?
185.怎么判断网站是否更新?
186.图片 、视频爬取怎么绕过防盗连接
187.你爬出来的数据量大概有多大?大概多长时间爬一次?
188.用什么数据库存爬下来的数据?部署是你做的吗?怎么部署?
189.增量爬取
190.爬取下来的数据如何去重,说一下scrapy的具体的算法依据 。
191.Scrapy的优缺点?
192.怎么设置爬取深度?
193.scrapy和scrapy-redis有什么区别?为什么选择redis数据库?
194.分布式爬虫主要解决什么问题?
195.什么是分布式存储?
196.你所知道的分布式爬虫方案有哪些?
197.scrapy-redis ,有做过其他的分布式爬虫吗?
198.主键 超键 候选键 外键
199.视图的作用 ,视图可以更改么?
200.drop,delete与truncate的区别
201.索引的工作原理及其种类
202.连接的种类
203.数据库优化的思路
204.存储过程与触发器的区别
205.悲观锁和乐观锁是什么?
206.你常用的mysql引擎有哪些?各引擎间有什么区别?
207.Redis宕机怎么解决?
208.redis和mecached的区别,以及使用场景
209.Redis集群方案该怎么做?都有哪些方案?
210.Redis回收进程是如何工作的
211.MongoDB中对多条记录做更新操作命令是什么?
212.MongoDB如何才会拓展到多个shard里?
213.编写测试计划的目的是
214.对关键词触发模块进行测试
215.其他常用笔试题目网址汇总
216.测试人员在软件开发过程中的任务是什么
217.一条软件Bug记录都包含了哪些内容?
218.简述黑盒测试和白盒测试的优缺点
219.请列出你所知道的软件测试种类,至少5项
220.Alpha测试与Beta测试的区别是什么?
221.举例说明什么是Bug?一个bug report应包含什么关键字?
222.数组中出现次数超过一半的数字-Python版
223.求100以内的质数
224.无重复字符的最长子串-Python实现
225.通过2个5/6升得水壶从池塘得到3升水
226.什么是MD5加密 ,有什么特点?
227.什么是对称加密和非对称加密
228.冒泡排序的思想?
229.快速排序的思想?
230.如何判断单向链表中是否有环?
231.你知道哪些排序算法(一般是通过问题考算法)
232.斐波那契数列
233.如何翻转一个单链表?
234.青蛙跳台阶问题
235.两数之和 Two Sum
236.搜索旋转排序数组 Search in Rotated Sorted Array
237.Python实现一个Stack的数据结构
238.写一个二分查找
239.set 用 in 时间复杂度是多少,为什么?
240.列表中有n个正整数范围在[0,1000] ,进行排序;
241.面向对象编程中有组合和继承的方法实现新的类
242.找出1G的文件中高频词
243.一个大约有一万行的文本文件统计高频词
244.怎么在海量数据中找出重复次数最多的一个?
245.判断数据是否在大量数据中
76.递归函数停止的条件?
递归的终止条件一般定义在递归函数内部,在递归调用前要做一个条件判断,根据判断的结果选择是继续调用自身 ,还是return,,返回终止递归 。
终止的条件:判断递归的次数是否达到某一限定值
2.判断运算的结果是否达到某个范围等 ,根据设计的目的来选择
77.下面这段代码的输出结果将是什么?请解释。
def multipliers():
return [lambda x: i *x for i in range(4)]
print([m(2) for m in multipliers()])
上面代码的输出结果是[6,6,6,6],不是我们想的[0,2,4,6]
你如何修改上面的multipliers的定义产生想要的结果?
上述问题产生的原因是python闭包的延迟绑定。这意味着内部函数被调用时,参数的值在闭包内进行查找 。因此 ,当任何由multipliers()返回的函数被调用时,i的值将在附近的范围进行查找。那时 ,不管返回的函数是否被调用,for循环已经完成,i被赋予了最终的值3.
def multipliers():
for i in range(4):
yield lambda x: i *x
def multipliers():
return [lambda x,i = i: i*x for i in range(4)]
78.什么是lambda函数?它有什么好处?写一个匿名函数求两个数的
和
lambda函数是匿名函数 ,使用lambda函数能创建小型匿名函数,这种函数得名于省略了用def声明函数的标准步骤
79.对设计模式的理解,简述你了解的设计模式?
设计模式是经过总结 ,优化的,对我们经常会碰到的一些编程问题的可重用解决方案。一个设计模式并不像一个类或一个库那样能够直接作用于我们的代码,反之 ,设计模式更为高级,它是一种必须在特定情形下实现的一种方法模板 。
常见的是工厂模式和单例模式
80.请手写一个单例
81.单例模式的应用场景有那些?
单例模式应用的场景一般发现在以下条件下:
资源共享的情况下,避免由于资源操作时导致的性能或损耗等 ,如日志文件,应用配置。
控制资源的情况下,方便资源之间的互相通信。如线程池等 ,
1,网站的计数器 2,应用配置 3.多线程池 4数据库配置 数据库连接池 5.应用程序的日志应用…
82.用一行代码生成[1,4,9,16,25,36,49,64,81,100]
print([x*x for x in range(1, 11)])
83.对装饰器的理解 ,并写出一个计时器记录方法执行性能的装饰
器?
装饰器本质上是一个callable object ,它可以让其他函数在不需要做任何代码变动的前提下增加额外功能,装饰器的返回值也是一个函数对象 。
84.解释以下什么是闭包?
在函数内部再定义一个函数 ,并且这个函数用到了外边函数的变量,那么将这个函数以及用到的一些变量称之为闭包。
85.函数装饰器有什么作用?
装饰器本质上是一个callable object,它可以在让其他函数在不需要做任何代码的变动的前提下增加额外的功能。装饰器的返回值也是一个函数的对象 ,它经常用于有切面需求的场景 。比如:插入日志,性能测试,事务处理 ,缓存。权限的校验等场景,有了装饰器就可以抽离出大量的与函数功能本身无关的雷同代码并发并继续使用。
详细参考:https://manjusaka.itscoder.com/2018/02/23/something-about-decorator/
86.生成器,迭代器的区别?
迭代器是遵循迭代协议的对象 。用户可以使用 iter() 以从任何序列得到迭代器(如 list, tuple,dictionary, set 等) 。另一个方法则是创建一个另一种形式的迭代器 —— generator 。要获取下一个元素 ,则使用成员函数 next()(Python 2)或函数 next() function (Python 3) 。当没有元素时,则引发 StopIteration 此例外 。若要实现自己的迭代器,则只要实现 next()(Python 2)或 next ()(Python 3)
生成器(Generator) ,只是在需要返回数据的时候使用yield语句。每次next()被调用时 ,生成器会返回它脱离的位置(它记忆语句最后一次执行的位置和所有的数据值)
区别: 生成器能做到迭代器能做的所有事,而且因为自动创建iter()和next()方法,生成器显得特别简洁 ,而且生成器也是高效的,使用生成器表达式取代列表解析可以同时节省内存。除了创建和保存程序状态的自动方法,当发生器终结时 ,还会自动抛出StopIteration异常 。
官方介绍:https://docs.python.org/3/tutorial/classes.html#iterators
87.X是什么类型?
X= (i for i in range(10))
X是 generator类型
88.请用一行代码 实现将1-N 的整数列表以3为单位分组
N =100
print ([[x for x in range(1,100)] [i:i+3] for i in range(0,100,3)])
89.Python中yield的用法?
yield就是保存当前程序执行状态。你用for循环的时候,每次取一个元素的时候就会计算一次。用yield的函数叫generator,和iterator一样,它的好处是不用一次计算所有元素 ,而是用一次算一次,可以节省很多空间,generator每次计算需要上一次计算结果 ,所以用yield,否则一return,上次计算结果就没了
90.Python中的可变对象和不可变对象?
不可变对象,该对象所指向的内存中的值不能被改变 。当改变某个变量时候 ,由于其所指的值不能被改变 ,相当于把原来的值复制一份后再改变,这会开辟一个新的地址,变量再指向这个新的地址。
可变对象 ,该对象所指向的内存中的值可以被改变。变量(准确的说是引用)改变后,实际上其所指的值直接发生改变,并没有发生复制行为 ,也没有开辟出新的地址,通俗点说就是原地改变 。
Pyhton中,数值类型(int 和float) ,字符串str、元祖tuple都是不可变类型。而列表list、字典dict 、集合set是可变类型
91.Python的魔法方法
魔法方法就是可以给你的类增加魔力的特殊方法,如果你的对象实现(重载)了这些方法中的某一个,那么这个方法就会在特殊的情况下被Python所调用 ,你可以定义自己想要的行为,而这一切都是自动发生的,它们经常是两个下划线包围来命名的(比如 init_ , len ),Python的魔法方法是非常强大的所以了解其使用方法也变得尤为重要!
init 构造器 ,当一个实例被创建的时候初始化的方法 ,但是它并不是实例化调用的第一个方法。
new 才是实例化对象调用的第一个方法,它只取下cls参数,并把其他参数传给 init_ .
new 很少使用 ,但是也有它适合的场景,尤其是当类继承自一个像元祖或者字符串这样不经常改变的类型的时候 。
call 让一个类的实例像函数一样被调用
getitem 定义获取容器中指定元素的行为,相当于self[key]
getattr 定义当用户试图访问一个不存在属性的时候的行为 。
setattr 定义当一个属性被设置的时候的行为
getattribute 定义当一个属性被访问的时候的行为
92.面向对象中怎么实现只读属性?
将对象私有化 ,通过共有方法提供一个读取数据的接口
最好的方法
93.谈谈你对面向对象的理解?
面向对象是相当于面向过程而言的,面向过程语言是一种基于功能分析的,以算法为中心的程序设计方法 ,而面向对象是一种基于结构分析的,以数据为中心的程序设计思想。在面向对象语言中有一个很重要的东西,叫做类。面向对象有三大特性:封装、继承、多态 。
94.请写出一段代码用正则匹配出ip?
95.a = “abbbccc” ,用正则匹配为abccc,不管有多少b,就出现一
次?
思路:不管有多少个b替换成一个
re.sub(r'b+', 'b', a)
96.Python字符串查找和替换?
97.用Python匹配HTML tag的时候,<.> 和 <.?> 有什么区别
第一个代表贪心匹配 ,第二个代表非贪心;
?在一般正则表达式里的语法是指的"零次或一次匹配左边的字符或表达式"相当于{0,1} 而当?后缀于*,+,?,{n},{n,},{n,m}之后 ,则代表非贪心匹配模式,也就是说,尽可能少的匹配左边的字 符或表达式 ,这里是尽可能少的匹配.(任意字符)
所以:第一种写法是,尽可能多的匹配,就是匹配到的字符串尽量长 ,第二中写法是尽可能少的匹配,就是匹 配到的字符串尽量短。
比如tag>tag>end,第一个会匹配tag>tag>,第二个会匹配。
98.正则表达式贪婪与非贪婪模式的区别?
贪婪模式:
定义:正则表达式去匹配时 ,会尽量多的匹配符合条件的内容 标识符:+,?,* ,{n},{n,},{n,m} 匹配时 ,如果遇到上述标识符 ,代表是贪婪匹配,会尽可能多的去匹配内容
非贪婪模式:
定义:正则表达式去匹配时,会尽量少的匹配符合条件的内容 也就是说 ,一旦发现匹配符合要求,立马就匹 配成功,而不会继续匹配下去(除非有g ,开启下一组匹配) 标识符:+?,??,*? ,{n}?,{n,}?,{n,m}? 可以看到 ,非贪婪模式的标识符很有规律,就是贪婪模式的标识符后面加上一个?
99.写出开头匹配字母和下划线,末尾是数字的正则表达式?
s1='_aai0efe00'
res=re.findall('^[a-zA-Z_]?[a-zA-Z0-9_]{1,}\d$',s1)
print(res)
个人公众号 yk 坤帝
后台回复 项目五 获取整理资源