ClickHouse, la startup de base de datos de análisis en tiempo real de código abierto que se separó de Yandex en 2021, anunció el martes que ha adquirido PeerDB, una empresa que se centra en la replicación rentable de Postgres y la captura de datos de cambio.
Desde su lanzamiento, y aún antes, durante su tiempo como proyecto de código abierto respaldado por Yandex, ClickHouse se ha destacado como un almacén de datos en tiempo real para grandes empresas. Su lista de clientes incluye a Deutsche Bank, eBay, Fastly, GitLab, HubSpot, Microsoft, ServiceNow y Spotify. Y aunque ClickHouse ya ofrecía un conector de Postgres para ayudar a las empresas a trasladar sus datos desde la popular base de datos relacional a su base de datos de análisis, PeerDB ofrece mejoras de velocidad de hasta 10 veces, así como un número de capacidades especializadas que ClickHouse no ofrecía anteriormente.
«Comenzamos nuestro viaje construyendo una herramienta de ETL de movimiento de datos con un enfoque láser en Postgres. Comenzamos con esta área de proporcionar la mejor manera del mundo de replicar datos desde Postgres a almacenes de datos. … Lanzamos nuestro conector de ClickHouse hace unos seis meses, y desde entonces, solo ha estado creciendo y ahora es el conector de más rápido crecimiento, superando a otros almacenes de datos como Snowflake y BigQuery», dijo Sai Srirampur, cofundador y CEO de PeerDB. Antes de comenzar con PeerDB, Srirampur trabajó en el servicio de PostgreSQL de Azure después de que Microsoft adquirió Citus Data, donde trabajó anteriormente.
Srirampur me dijo que siempre quiso que PeerDB se centrara en «calidad sobre cantidad», lo que llevó al equipo a centrarse exclusivamente en la construcción de una herramienta de ETL especializada para Postgres. Esto incluye la carga inicial de lo que pueden ser terabytes de datos de una base de datos de Postgres a un almacén como ClickHouse, pero quizás lo más importante, también el sistema de captura de datos de cambio, que garantiza que la base de datos original y el almacén de datos se mantengan sincronizados.
Resulta que, para la mayoría de los clientes de PeerDB, Postgres era la principal fuente de datos para su almacén de datos. Quizás no sea una sorpresa, dado que es más probable que esos clientes elijan un servicio como PeerDB, pero claramente ClickHouse también vio un mercado en crecimiento para una herramienta como esta.

“Lo que estamos viendo muy, muy a menudo es [clientes] que utilizan Postgres como el backend transaccional para aplicaciones orientadas al cliente, y luego trasladan esos datos a ClickHouse para casos de uso de análisis; este es un patrón muy, muy común, y hay varios clientes que lo están utilizando», dijo Yury Izrailevsky, cofundador de ClickHouse. «Por supuesto, Postgres es una tecnología muy compleja. Es muy potente, pero realmente requiere un conocimiento profundo, especialmente para casos de uso de Captura de Datos de Cambio.»
Con el tiempo, el equipo de PeerDB trabajará en habilitar la captura de datos de cambio para fuentes de datos adicionales también. Los clientes comerciales existentes podrán utilizar el servicio en la nube de PeerDB hasta el 24 de julio de 2025.
Los componentes de código abierto existentes de PeerDB seguirán siendo de código abierto, sin cambios en sus licencias. ClickHouse también abrirá el código fuente de los gráficos Helm de grado de producción para la oferta empresarial de PeerDB.
Las dos empresas no revelaron el precio de la adquisición, pero vale la pena mencionar que PeerDB cerró una ronda de financiamiento semilla de $3.6 millones a finales de 2023, con 8VC liderando la ronda.
«Creo que acordamos un precio justo que recompensa y reconoce adecuadamente el trabajo que ha realizado el equipo de PeerDB y que es justo tanto para el equipo como para sus inversores», dijo Izrailevsky. «Al mismo tiempo, creo que sigue siendo una gran oportunidad para nosotros, dada la gran potencial».
