河南郑州-中科院计算所大数据研究院(招资深爬虫)

岗位职责

1、负责设计、开发、维护大数据分析处理相关的软件产品和模块;

2、搭建数据采集平台,建立爬虫系统,通过对数据的抓取、解析、调度、存储等模块的拆分与优化,构建和完善统一的抓取服务平台;

3、负责网页信息抽取等核心算法的研究和优化;

4、负责重点目标站点的结构与URL特点分析,负责垂直领域与定向网站的数据采集、维护及数据异常的跟踪处理,为品牌提供竞品市场分析等数据支撑。

\

任职要求

1、专科以上,3年以上爬虫经验;

2、熟悉Linux开发环境;熟练掌握Python语言;

3、熟悉网页抓取原理及技术,熟悉基于Cookie的网站登录原理,熟悉基于正则表达式、Xpath、CSS等网页信息抽取技术;

4、响应抓取需求,能快速高效的完成开发任务,具备良好的沟通能力和管理能力;

5、具备信息检索、自然语言处理、web挖掘等搜索引擎相关知识,有从事海量网络爬虫、网页去重、网页信息抽取的开发经验;

6、工作态度踏实、认真、积极主动,能承受一定工作压力,有责任心、有团队协作能力。

事业单位+二线城市工资都不高,一般也有 10-15k 左右。
愿意的邮箱:chenwenzhi@ictbda.cn

讨论数量: 0
(= ̄ω ̄=)··· 暂无内容!

讨论应以学习和精进为目的。请勿发布不友善或者负能量的内容,与人为善,比聪明更重要!