南开大学23春学期《网络爬虫与信息提取》在线作业【奥鹏作业答案】【毕业论文辅导】

内容摘要:
23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《网络爬虫与信息提取》在线作业-0 试卷总分:100 得分:100 一、单选题 (共 20 道试题,共 40 分) 1.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息
电大形考任务,国家开放大学作业答案,广东开放大学作业答案,电大作业答案。

作业 考核 论文 答案 一请联系 微--xhmcz122 Q-210969415

23春学期(高起本:1709-2103、专升本/高起专:1909-2103)《网络爬虫与信息提取》在线作业-0
试卷总分:100  得分:100
一、单选题 (共 20 道试题,共 40 分)
1.在Scrapy的目录下,哪个文件负责存放爬虫的各种配置信息?()
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
2.参数headers=(),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的。
A.HEADER
B.HEADERS
C.HEAD
D.BODY
3.可以通过()绕过网站登录。
A.session
B.cookies
C.moonpies
D.localstorage
4.下面代码一共执行循环多少次(): i=0 while i<10: i+=1
A.9
B.10
C.11#0
5.Python并导入uiautomator来操作设备的语句是from uiautomator import ()
A.Device
B.Devices
C.Jobs
D.Job
6.Python中的()库用于发送网络请求
A.web
B.request
C.requests
D.javascript
7.Scrapy中使用Xpath获得的结果调用了.extract方法,结果以()形式生成
A.列表
B.元组
C.字典
D.集合
8.HTTP常用状态码表明服务器上没有请求的资源的是()
A.500
B.503
C.403
D.404
9.通常使用()工具来模拟浏览器进行爬虫请求
A.Selenium
B.Chrome
C.ChromeDriver
D.WebDriver
10.PyMongo中查询所有age > 29的记录是()
A.collection.find({'age': {'$gt': 29}})
B.collection.find({'age'>29})
C.collection.find_all({'age': {'$gt': 29}})
D.collection.find_all({'age'>29})
11.使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()
A.content
B.text
C.title
D.body
12.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。
A.字典
B.集合的名字
C.集合
D.文档
13.使用UI Automator打开微信的操作是获取相应图标后使用命令()
A.touch
B.click
C.push
D.hover
14.Scrapy自带的待爬队列是()
A.deque
B.queue
C.list
D.lqueue
15.启动MongoDB使用命令mongod --() usr/local/etc/mongod.conf
A.config
B.install
C.start
D.begin
16.在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()
A.spiders文件夹
B.item.py
C.pipeline.py
D.settings.py
17.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
A.字典
B.集合的名字
C.集合
D.文档
18.Python中哪种容器一旦生成就不能修改
A.列表
B.元组
C.字典
D.集合
19.使用xpath方法的返回类型是()
A.列表
B.元组
C.字典
D.集合
20.python中可以用来将图片中的文字转换为文本的第三方类库是
A.lxml
B.requests
C.beautifulsoup
D.pytesseract
二、多选题 (共 10 道试题,共 20 分)
21.requests中post请求方法的第二个参数可以为()
A.字典
B.列表
C.json数据
D.字符串
22.Redis中的值可以支持()
A.列表
B.哈希
C.集合
D.有序集合
23.HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A.403
B.404
C.500
D.503
24.下载器中间件的作用有哪些?
A.更换代理IP
B.更换Cookies
C.更换User-Agent
D.自动重试
25.最常见的HTTP请求类型有()
A.GET
B.POST
C.SEND
D.RECEIVE
26.Python中的容器有()
A.列表
B.元组
C.字典
D.集合
27.如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A.非法侵入计算机系统罪
B.非法获取计算机信息系统数据罪
C.非法获取计算机数据罪
D.非法获取系统罪
28.要使用tesseract来进行图像识别,需要安装两个第三方库
A.requests
B.beautifulsoup
C.Pillow
D.pytesseract
29.Python中有哪些实现多线程方法()
A.multiprocess.dummy
B.threading.Thread
C.process
D.PyMongoDB
30.在配置ios使用Charles的操作中,正确的有()
A.对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B.选择"HTTP代理"下面的"手动"选项卡,在"服务器"处输入计算机的IP地址,在"端口"处输入8888
C.输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D.安装完成证书以后,在设置中打开"关于本机",找到最下面的"证书信任设置",并在里面启动对Charles证书的完全信任
三、判断题 (共 20 道试题,共 40 分)
31.所有的异步加载都会向后台发送请求
32.当运行爬虫代码后,出现"Forbidden by robots.txt"提示后,说明当前时间段被爬取的网站无法访问。
33.Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
34.PyMongoDB中排序方法sort第二个参数-1表示升序
35.通用网络爬虫通常采用串行工作方式
36.Python中写CSV文件的writerows方法参数为字典类型
37.在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线
38.MongoDB URI的格式为: mongodb://服务器IP或域名:端口@用户名:密码
39.操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。
40.如果MongoDB运行在所在的计算机上,MONGODB_HOST应该写成"192.168.0.1"
41.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
42.在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的
43.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
44.HTTP只能通过POST请求才能发送数据
45.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。
46.使用AJAX技术,可以在不刷新网页的情况下更新网页数据
47."curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID"该命令的作用是启动爬虫
48.如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是首先把数据或者分析结果出售给某基金公司,然后自己再买被爬公司的股票。此时,涉嫌内幕交易,属于严重违法行为。
49.Redis中查询列表长度命令llen中l代表left,即从左侧开始数
50.爬虫中间件的作用对象是请求request和返回response

4.报表的数据源可以是( ) A.表或视图 B.表或查询 C.表、查询或视图 D.表或其他报表 答案:A 5.操作对象只能是一个表的关系运算是( ) A.联接和选择 B.联接和投影 C.选择和投影 D.自然连接和选择 答案:C 6.下列叙述中正确的是( ) A.为了建立一个关系,首先要构造数据的逻辑关系 B.表示关系的二维表中各元组的每一个分量还可以分成若干数据项 C.一个关系的属性名表称为关系模式 D.一个关系可以包括多个二维表 答案:A 7.在创建数据库表结构时,为该表中一些字段建立普通索引,其目的是( ) A.改变表中记录的物理顺序 B.为了对表进行实体完整性约束 C.加快数据库表的更新速度 D.加快数据库表的查询速度 答案:D 8.SQL语句中删除视图的命令是( ) A.DROP TABLE B.DROP VIEW C.ERASE TABLE D.ERASE VIEW 答案:B 9.设有两个数据库表,父表和子表之间是一对多的联系,为控制子表和父表的关联,可以设置“参照完整性规则”,为此要求这两个表( ) A.在父表连接字段上建立普通索引,在子表连接字段上建立主索引 B.在父表连接字段上建立主索引,在子表连接字段上建立普通索引 C.在父表连接字段上不需要建立任何索引,在子表连接字段上建立普通索引 D.在父表和子表的连接字段上都要建立主索引 答案:B 10.以下所列各项属于命令按钮事件的是( ) A.Parent B.This C.ThisForm D.Click 答案:D 11.在Visual FoxPro 中以下叙述正确的是( ) A.利用视图可以修改数据 B.利用查询可以修改数据 C.查询和视图具有相同的作用 D.视图可以定义输出去向 答案:A .现代企业制度的核心是()。 A.产权清晰 B.责任明确 C.政企分开 D.管理科学 答案:A 2.()指对企业的微观构造及其相关制度安排所作出的一系列界定、规制与约束的总和,具体表现为企业组织、运营、管理等一系列行为的规范化和制度化。 A.企业制度 B.企业战略 C.企业使命 D.企业远景 答案:A 3.1961年12月,美国著名管理学教授()发表了《管理理论的丛林》一文,对现代管理理论中的各种学派加以了分类和详细说明。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.哈罗德?孔茨 答案:D 4.被誉为“科学管理之父”的管理学家是 ( ) A.欧文 B.韦伯 C.法约尔 D.泰罗 答案:D 5.系统最基本的特征是()。 A.集合性 B.层次性 C.相关性 D.动态性 答案:A 6.一般认为管理科学是从美国管理学家( )开始出现的。 A.享利·普尔 B.麦卡勒姆 C.泰罗 D.法约尔 答案:C 7.民主管理是一种以( )为中心的管理。 A.事 B.效率 C.民主权利 D.人 答案:D 8.泰罗在管理方面的主要著作是 ( )。 A.《工业管理与一般管理》 B.《科学管理原理》 C.《管理学一般原理》 D.《组织》 答案:B 9.()是由上级主管部门下达的起导向作用的计划。 A.指导性计划 B.指令性计划 C.短期计划 D.长期计划 答案:A 二、多选题 (共 13 道试题,共 26 分) 10.企业决策的类型按决策的重要性分包括()。 A.长期决策 B.战略决策 C.战术决策 D.业务决策 答案:BCD 11.企业文化的功能包括()。 A.导向功能 B.凝聚功能 C.激励功能 D.约束功能 答案:ABCD 12.计划作为一种管理功能,具有如下特点() A.计划具有目的性 B.计划具有普遍性 C.计划具有适应性 D.计划具有经济性 答案:ABCD 12.设有表示学生选课的三张表,学生S(学号,姓名,性别,年龄,身份证号),课程C(课号,课名),选课SC(学号,课号,成绩),则表SC的关键字(键或码)为( ) A.课号,成绩 B.学号,成绩 C.学号,课号 D.学号,姓名,成绩 答案:C 13.MODIFY STRUCTURE命令的功能是( ) A.修改记录值 B.修改表结构 C.修改数据库结构 D.修改数据库或表结构 答案:B 14.在超市营业过程中,每个时段要安排一个班组上岗值班,每个收款口要配备两名收款员配合工作,共同使用一套收款设备为顾客服务,在超市数据库中,实体之间属于一对一关系的是( ) A.“顾客”与“收款口”的关系 B.“收款口”与“收款员”的关系 C.“班组”与“收款口”的关系 D.“收款口”与“设备”的关系 答案:D 15.下面关于类、对象、属性和方法的叙述中,错误的是( ) A.类是对一类相似对象的描述,这些对象具有相同种类的属性和方法 B.属性用于描述对象的状态,方法用于表示对象的行为 C.基于同一个类产生的两个对象可以分别设置自己的属性值 D.通过执行不同对象的同名方法,其结果必然是相同的 答案:D 16.在查询设计器环境中,“查询”菜单下的“查询去向”命令指定了查询结果的输出去向,输出去向不包括( ) A.临时表 B.表 C.文本文件 D.屏幕 答案:C 17.以下关于“查询”的描述正确的是( ) A.查询保存在项目文件中 B.查询保存在数据库文件中 C.查询保存在表文件中 D.查询保存在查询文件中 答案:D

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

留言与评论(共有 条评论)
   
验证码: