在存档站点中搜索

在存档站点中搜索

我们的团队正在致力于一项独特的服务,该服务结合了Web存档系统(archive.org)和搜索引擎的功能。

历史数据非常重要。

创建Archivarix网站恢复服务的经验使我们能够着手进行大型工作。

全文搜索

全文搜索

我们对所有检索到的数据进行分类和索引,以便于搜索。

数据存储

数据不会被删除,并以方便的格式存储以供进一步处理。

数据存储
方便处理数据

方便处理数据

从技术上讲,保存的站点是静态的。诸如Archivarix CMS之类的工具可让您在单个站点中查看和编辑它们,添加动态零件,合并来自不同站点的数据并进行必要的优化,而无需掌握技术知识。

2020

从2017年启动Archivarix Site Restore项目开始,我们就开始并行收集实时站点数据。

2020

自2009年以来,我们已经收集并正在收集各种网站指标和域信息的历史指标,并且每天都会更新。

2020

我们为全文搜索和内容分类处理的网站的内容始于1996年。

0中号 +

我们的数据库包含有关超过3.5亿个域的历史数据的信息。

1+

涉及的Spider和Archivarix处理服务器的数量已超过50。

1国标 +

我们的服务器每天从Internet下载超过100GB的网站内容。

分析来自不同来源的网站。

每天,我们都会收集和分析来自各种来源的域和站点的大约50GB指标数据。下面列出了其中一些。

商标 Ahrefs

我们在2010年发布了自己的反向链接索引,如今,它们的蜘蛛每天抓取多达80亿个页面。

商标 Alexa Internet

自1996年以来,Alexa Internet一直在收集网站流量统计信息,全球排名和其他信息。 1999年,亚马逊购买了该服务。

商标 Internet Archive

由Brewster Keil创立,后者几年前创立了Alexa Internet。自1996年以来保留网页的副本,并存档各种格式的材料以供免费访问。

商标 Cisco

开发和销售网络设备的公司。但是除此之外,它还提供了安全方面的有用数据,这些数据是根据设备的统计数据得出的。

商标 Icann

一家独立的国际公司,负责管理域名,IP地址和Internet的其他重要方面。

商标 Majestic SEO

自2008年以来最初称为MajesticSEO,它为网站管理员提供了许多有用的工具。

商标 Moz

该服务(最初称为SEOmoz)成立于2004年,是一个博客和在线帖子,主题是搜索引擎优化。现在,它为网站管理员提供了许多有用的工具。

商标 Verisign

这家美国公司不仅维护13个DNS根目录服务中的两个,而且还管理Internet .com和.net上两个最重要的域区域的注册表。