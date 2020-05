Op internet zijn duizenden onbeveiligde Elasticsearch- en Hadoop-clusters te vinden die petabytes aan data lekken, zo blijkt uit een inventarisatie door zoekmachine Shodan. De afgelopen jaren zijn er tal van datalekken in het nieuws geweest door Elasticsearch- en Hadoop-installaties die voor iedereen op internet toegankelijk waren. Ondanks deze berichten is de situatie alleen maar erger geworden.

Elasticsearch is zoekmachinesoftware voor het indexeren van allerlei soorten informatie. Het wordt onder andere ingezet voor het doorzoeken van websites, documenten en applicaties, maar is ook te gebruiken voor analytics, monitoring en data-analyse. Vorig jaar besloot Elastic, ontwikkelaar van de software, om een aantal beveiligingsmaatregelen ook voor de gratis versie van het platform beschikbaar te maken.

Desondanks blijkt uit cijfers van zoekmachine Shodan dat de hoeveelheid data die via onbeveiligde Elasticsearch-clusters is te vinden alleen maar is toegenomen. Ging het in 2018 nog om zo'n 900 terabyte, inmiddels is dat gestegen naar 3,2 petabyte. In totaal vond Shodan 28.000 Elasticsearch-clusters die via internet toegankelijk zijn.

Het aantal onbeveiligde Hadoop-clusters nam sinds 2018 juist af, maar de data die deze clusters bevatten nam juist toe. Het Hadoop Distributed File System (HDFS) is een gedistribueerd bestandssysteem voor het opslaan van grote hoeveelheden data. In 2018 telde Shodan nog zo'n vierduizend onbeveiligde HDFS-clusters. Dat is inmiddels naar zo'n achthonderd clusters gedaald. De hoeveelheid data die deze clusters lekken steeg echter van 5,1 petabyte in 2018 naar 13,1 petabyte dit jaar. De meeste onbeveiligde Elasticsearch- en Hadoop-clusters bevinden zich in China.