南开22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00001(标准答案)
时间:2023-04-08 点击:375次
00
22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00001(标准答案) 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题 A.s B.c C.d D.r 答案:D 2.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令() A.content B.text C.title D.body 答案:B 3.Python中Object={1, 2, 3, 4, 5},则Objcet是() A.列表 B.元组 C.字典 D.集合 答案:D 4.使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令() A.scroll.left B.scroll.horiz.left C.scroll.forward D.scroll.horiz.forward 答案:D 5.chrome默认打开开发者工具的快捷是 A.F5 B.F11 C.F12 D.F2 答案:C 6.Python中把列表转换为集合需要使用##函数 A.set B.list C.convert D.change 答案:A 7.Python中跳过本次循环应用关键字() A.break B.continue C.exit D.return 答案:B 8.PyMongo中逻辑查询表示大于等于的符号是() A.$gt B.$lt C.$gte D.$lte 答案:C 9.PyMongo中逻辑查询表示小于的符号是() A.$gt B.$lt C.$gte$$lte 答案:B 10.可以通过()绕过网站登录。 A.session B.cookies C.moonpies D.localstorage 答案:B 11.requests中post请求方法的使用为requests.post('网址', data=data)中的data为() A.列表 B.元组 C.字典 D.集合 答案:C 12.在Linux中哪个命令是添加权限的() A.chmod B.sudo C.cp D.mkdir 答案:A 13.在Scrapy的目录下,哪个文件负责存放爬虫文件?() A.spiders文件夹 B.item.py C.pipeline.py D.settings.py 答案:A 14.Python中退出循环应用关键字() A.break B.continue C.exit D.return 答案:A 15.Python中专门用来处理图像的第三方库是 A.lxml B.Pillow C.beautifulsoup D.pytesseract 答案:B 16.Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是() A.1 B.2 C.3 D.无输出 答案:A 17.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令() A.exist B.exists C.isnull D.contains 答案:B 18.使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令() A.scroll_forwad B.scroll_up C.scroll.forward D.scroll.vert.forward 答案:D 19.如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个() A.列表 B.元组 C.字典 D.集合 答案:C 20.当需要把Python里面的数据发送给网页时,应先将其转换成() A.Json字符串 B.GET C.POST D.Request 答案:A 二、多选题 (共 10 道试题,共 20 分) 21.Python中的容器有() A.列表 B.元组 C.字典 D.集合 答案:ABCD 22.Python中()容器有推导式 A.列表 B.元组 C.字典 D.集合 答案:ACD 23.MongoDB中获取名字为db的库的语句为() A.client.db B.client('db') C.client['db'] D.client{'db'} 答案:AC 24.以下HTTP状态码表示服务器本身发生错误的是 A.400 B.503 C.302 D.500 答案:BD 25.cookies的缺点是 A.实现自动登录 B.跟踪用户状态 C.http中明文传输 D.增加http请求的流量 答案:CD 26.requests中post请求方法的第二个参数可以为() A.字典 B.列表 C.json数据 D.字符串 答案:AC 27.以下哪些可以独立成为Python编译器() A.Pycharm B.IDLE C.Eclipse D.Visual Studio 2010 答案:AB 28.一个可行的自动更换代理的爬虫系统,应该下列哪些功能? A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中 B.在发现某个请求已经被设置过代理后,什么也不做,直接返回 C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用 D.周期性验证数据库中的无效代理,及时将其删除 答案:ACD 29.HTTP常用状态码表明请求被正常处理的有() A.200 B.301 C.302 D.204 答案:AD 30.Python中一个函数可以有()个return语句 A.0 B.1 C.多个 D.2 答案:ABCD 三、判断题 (共 20 道试题,共 40 分) 31.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。 答案:正确 32.一般来说在页面都通过GET将用户登录信息传递到服务器端。 答案:错误 33.MongoDB是一个关系数据库产品 答案:错误 34.PyMongoDB中排序方法sort第二个参数-1表示升序 答案:错误 35.Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。 答案:正确 36.上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。 答案:错误 37.Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次 答案:正确 38.使用AJAX技术,可以在不刷新网页的情况下更新网页数据 答案:正确 39.Redis中使用lrange读取数据后数据也会删除 答案:错误 40.Selenium必须加载对应的webdriver才能模拟浏览器访问 答案:正确 41.Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取 答案:错误 42.Redis中查询列表长度命令llen中l代表left,即从左侧开始数 答案:错误 43.Python中函数返回值的个数可以是多个 答案:正确 44.使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的 答案:正确 45.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据; 答案:错误 46.UI Automator Viewer与Python uiautomator可以同时使用 答案:错误 47.为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。 答案:正确 48.运行MongoDB以后,不会在终端打印任何Log 答案:错误 49.在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装 答案:错误 50.”curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该命令的作用是启动爬虫 答案:错误 |