依托有限算力的网络搜索引擎的实现文献综述

 2022-12-22 19:56:34
  1. 课题研究背景

在当今大数据时代的背景下,随着各行各业信息化的快速发展,各个垂直领域的信息数据呈爆炸式增长。无论是工作还是生活中,人们已经习惯了依赖互联网获取有效信息的生活方式,因此如何提供高质量的搜索结果是搜索引擎面对的主要问题。

  1. 课题研究意义

通过研究在较少数量的高性能计算机的有限算力的基础上,通过算法方面的转换与网络信息处理方面的优化,让搜索质量并不会显著下降来达到一种均衡.

  1. 拟解决的问题

根据标注的结直肠癌病理切片训练深度学习模型,使其输入病人相应的病理切片输出分子分型预测结果,并且预测结果达到一定的准确度。

  1. 研究主要内容

1、网络数据的初步收集与清理,存储于数据库中;

2、建立数据的倒排索引;

3、搜索网站的前端开发与分词技术实现;

4、对整体进行测试。

五、研究方法和步骤

1、通过requests和scrapy爬虫工具爬取一定的数据并清理,在存储到数据库中

2、运用elasticsearch对数据进行排序及索引建立

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。