暗网介绍
暗网是指互联网上的内容,不属于网络的表面网站,这是值得搜索引擎收录索引的内容。据估计,暗网是大于几个数量级表面网站。
早在2003年就有美国人C·谢尔曼写成了一本学术专著专门讨论这一问题,只不过通常把它翻译成“看不见”的网站,这本著作已经被译成中文——《“看不见”的网站:Internet专业信息检索指南》,成为信息检索专业的必读书目。
2008年12月18日百度宣布其在上海成立的研发中心正式揭牌,百度董事长兼CEO李彦宏以及CTO李一男出席现场。百度还宣布了“阿拉丁平台”计划,该计划为解决现有搜索无法抓取和检索互联网上存在的大量Hidden Web(暗网)问题。据悉,百度已经投入超过1千人研发该平台。
暗网资源:
- 动态内容
- 未被链接内容
- 私有网站
- Contextual Web
- 被限制存取内容
- 脚本化内容
- 非HTML/文本内容
编辑以上介绍 我要留言
|