Nuestro equipo está trabajando en un servicio único que combina las capacidades del sistema de archivo web (archive.org) y un motor de búsqueda.
La experiencia en la creación del servicio de recuperación de sitios de Archivarix nos permitió comenzar a trabajar en algo grande.
Clasificamos e indexamos todos los datos recuperados para facilitar la búsqueda.
Los datos no se eliminan y se almacenan en un formato conveniente para su posterior procesamiento.
Los sitios guardados son técnicamente estáticos. Herramientas como Archivarix CMS te permiten verlas y editarlas como un solo sitio, agregar una parte dinámica, combinar datos de diferentes sitios y hacer la optimización necesaria sin tener conocimientos técnicos.
A partir del lanzamiento del Proyecto de restauración del sitio Archivarix en 2017, hemos comenzado a recopilar datos del sitio en vivo en paralelo.
Hemos recopilado y estamos recopilando métricas históricas de varias métricas de sitios e información de dominio desde 2009, que actualizamos todos los días.
El contenido de los sitios que procesamos para la búsqueda de texto completo y la clasificación de contenido comienza en 1996.
Nuestra base de datos contiene información sobre datos históricos de más de 350 millones de dominios.
El número de servidores de procesamiento Spider y Archivarix involucrados ya supera los 50.
Nuestros servidores descargan más de 100 GB de contenido de sitios web de Internet todos los días.
Todos los días recopilamos y analizamos alrededor de 50 GB de datos de métricas para dominios y sitios de diversas fuentes. Algunos de ellos se enumeran a continuación.
Lanzamos nuestro propio índice de backlinks en 2010 y hoy sus arañas están rastreando hasta 8 mil millones de páginas por día.
Alexa Internet ha estado recopilando estadísticas de tráfico de sitios web, clasificaciones globales y otra información desde 1996. En 1999, Amazon compró el servicio.
Fundada por Brewster Keil, quien fundó Alexa Internet unos años antes. Conserva copias de páginas web desde 1996 y archiva varios formatos de material para acceso gratuito.
Una empresa que desarrolla y vende equipos de red. Pero además de esto, proporciona datos útiles en el campo de la seguridad, que se forma a partir de las estadísticas de sus equipos.
Una empresa internacional independiente que regula los nombres de dominio, direcciones IP y otros aspectos importantes de Internet.
Originalmente llamado MajesticSEO desde 2008, proporciona muchas herramientas útiles para webmasters.
El servicio (originalmente llamado SEOmoz) se fundó en 2004 como un blog y una publicación en línea sobre el tema de la optimización de motores de búsqueda. Ahora proporciona muchas herramientas útiles para webmasters.
La empresa estadounidense que mantiene dos de los trece servicios de DNS raíz y también gestiona los registros de dos de las zonas de dominio más importantes de Internet .com y .net.