Big data wordt zo groot dat het de nors banden van de aarde verliest.
Een startup genaamd Orbital Insight, die onlangs bijna $ 9 miljoen aan financiering heeft ingezameld, maakt gebruik van satellietbeelden en geavanceerde computertechnieken om het wereldwijde olie-overschot te schatten, oogsttekorten vóór de oogsttijd te voorspellen en retailtrends te herkennen door het aantal auto's in de gaten te houden grote box parkeerplaatsen. Het zou ook mogelijk moeten zijn om de software te trainen om illegale ontbossing vroegtijdig op te sporen en klimaatverandering beter te volgen.
Het bedrijf gebruikt technieken voor machinaal leren en computernetwerken die het menselijk brein nabootsen om patronen in enorme hoeveelheden visuele gegevens te herkennen. Facebook gebruikt vergelijkbare technieken om gezichten in geüploade afbeeldingen te herkennen en u en uw vrienden automatisch te taggen. Maar in plaats van naar gezichten te zoeken, profiteert Orbital Insight van de groeiende overvloed aan satellietbeelden, dankzij de opkomst van kleine, goedkope satellieten, en leert hun netwerken automatisch dingen zoals voertuigen, de bouwsnelheid in China en de schaduwen van oliecontainers met drijvend deksel, die veranderen afhankelijk van hoe vol ze zijn.
Het zou natuurlijk onmogelijk zijn voor mensen om regelmatig bijgewerkte wereldwijde satellietbeelden te doorzoeken. Maar met enorm parallelle computers en geavanceerde patroonherkenningstechnieken wil Orbital Insight soorten gegevens leveren die nog niet eerder beschikbaar waren. De huidige wereldwijde schattingen van olie zijn bijvoorbeeld al zes weken oud wanneer ze worden gepubliceerd. Met Orbital kan een analyse van gewasopbrengsten halverwege het seizoen worden geleverd - belangrijke informatie om te hebben, of u nu een medewerker van de Verenigde Naties op hoog niveau bent die een voedselcrisis probeert voor te zijn of een handelaar in grondstoffen die voor een hedgefonds werkt.
Orbital Insight bestaat niet lang - het werd eind 2013 opgericht en kwam pas vorig jaar uit de "stealth-modus". Maar de oprichter van het bedrijf, James Crawford, heeft veel ervaring op compatibele gebieden. Een voormalig autonomie en robotica hoofd van NASA's Ames Research Center, hij bracht ook twee jaar door als technisch directeur bij Google Books, waardoor gearchiveerde afgedrukte pagina's doorzoekbare tekst werden.
Verschillende bedrijven, zoals Spire en Inmarsat, en zelfs Tesla's Elon Musk, werken aan hardware - het ontwerpen en lanceren van nieuwe netwerken van satellieten - maar Crawford zegt dat Orbital Insight zich puur op software richt.
"In sommige opzichten zie ik wat we hier doen in de impuls van dit bedrijf, " zegt Crawford, "veel van het leren [bij Google] over hoe big data te doen, hoe [kunstmatige intelligentie] toe te passen, " hoe machine learning toe te passen op deze pijplijnen van beelden, en dat toe te passen op de satellietruimte. ”
Het bedrijf van Crawford is mogelijk een van de weinigen die werken aan het gebruik van opkomende softwaretechnieken zoals kunstmatige neurale netwerken en machine learning om satelliet te analyseren beeldspraak. Maar de techniek die hij gebruikt, ook wel deep learning genoemd, explodeert momenteel in de technologische ruimte. Gevestigde bedrijven zoals Facebook, Google en Microsoft maken gebruik van diepgaande leertechnieken voor zaken als automatisch taggen van afbeeldingen en verbeterde spraakherkenning en vertaling. IBM heeft onlangs ook een bedrijf voor diep leren gekocht, AlchemyAPI genaamd, om hun Watson-computersysteem te verbeteren.
Met diep leren, krachtige computers en meerdere lagen van gelijktijdig lopende patroonherkenning (vandaar de "diep" in diep leren) bootsen de neurale netwerken van het menselijk brein na. Het doel is om een computer te laten 'leren' om patronen te herkennen of taken uit te voeren die te complex en tijdrovend zijn om met traditionele software te 'onderwijzen'.
De details van diep leren zijn technisch, maar op het basisniveau is het verrassend eenvoudig. Als het gaat om het meten van retailtrends met parkeeractiviteit, zegt Crawford dat het bedrijf eerst werknemers heeft die auto's handmatig markeren op een paar honderd parkeerplaatsen met rode stippen. "Vervolgens voer je elke individuele auto in het neurale netwerk, en het generaliseert de patronen van licht en donker, het patroon van pixels van een auto, " zegt Crawford. "En wanneer [de computer] naar een nieuwe afbeelding kijkt, is wat het in wezen doet behoorlijk geavanceerd, maar nog steeds in wezen een patroonovereenkomst."
Bij het schatten van retailactiviteit zegt Crawford dat zijn bedrijf veel beter is in het afleiden van hoe een keten het op nationaal niveau doet, door te meten hoe vol parkeerplaatsen in de loop van de tijd zijn en dat te vergelijken met hoe vol dezelfde kavels in vorige kwartalen waren met behulp van oudere afbeeldingen, dan de gezondheid van een individuele winkel meten.
Hij geeft toe dat veel retailers al manieren hebben om deze gegevens voor hun eigen winkels bij te houden, maar ze zouden graag willen weten hoe hun concurrenten het doen maanden voordat de financiële resultaten worden vrijgegeven. Hetzelfde zou gelden voor hedgefondsen, die volgens Crawford tot de eerste klanten van het bedrijf behoren. Het is gemakkelijk om te zien hoe dit soort gegevens beleggers een voorsprong kan geven. De satellietbeelden zijn al beschikbaar en Orbital Insight ontleedt deze alleen maar, dus het is onwaarschijnlijk dat er problemen met voorkennis ontstaan.
Als het netwerk af en toe een fout maakt, bijvoorbeeld een container voor een auto verwarren, is dat geen probleem, legt Crawford uit, omdat de fouten elkaar op grote schaal opheffen. Voor dingen zoals olieschattingen, zelfs als ze met meerdere procentpunten af zijn, is het nog steeds beter dan tot zes weken wachten op meer concrete gegevens.
Hoewel de startup zich eerst richt op het verstrekken van gegevens aan marktinvesteerders, kan wat het bedrijf doet ook voor meer altruïstisch gebruik worden gebruikt. "We zijn in de toekomst nieuwsgierig om dit te gebruiken om ontbossing te detecteren, en om dingen zoals wegenbouw te detecteren die een voorloper van ontbossing kunnen zijn", zegt Crawford. "Er zijn ook echt interessante dingen die gedaan kunnen worden rond kijken naar sneeuwpakket, water en andere aspecten voor klimaatverandering." Hij zegt ook dat ze kijken naar landbouw in de derde wereld, en zegt dat multispectrale beelden een goede manier zijn om te vertellen hoe gezond planten zijn, om mislukte gewassen te voorspellen.
Natuurlijk brengt elk aspect van big data dat ook satellietbeelden omvat privacykwesties met zich mee. Maar Orbital Insight maakt geen foto's, ze bekijken en analyseren al beschikbare afbeeldingen. En zoals Crawford aangeeft, bepalen de huidige Amerikaanse voorschriften voor commerciële beeldvormingssatellieten dat je niet onder de 20 cm per pixel mag gaan. Bij die resolutie zou de gemiddelde persoon als een paar puntjes verschijnen. Het zou dus moeilijk zijn om individuele mensen te onderscheiden, laat staan iemands identiteit of zelfs geslacht.
Crawford zegt dat veel van de vorderingen op de korte termijn in diepgaande leertechnieken in het algemeen het vereenvoudigen en automatiseren van de aanpassingen aan de algoritmen (dat wil zeggen minder handmatig taggen van auto's of maïsvelden) met zich meebrengt, zodat bedrijven machine learning sneller kunnen toepassen op nieuwe gebieden.
Wat betreft de toekomst van Orbital Insight, de oprichter van het bedrijf spreekt absoluut niet klein. Hij vergelijkt wat het bedrijf doet om een 'macroscoop' te maken die de wereld in dezelfde mate kan beïnvloeden als de microscoop de biologie heeft veranderd.
“Veel van wat we over de aarde zien, of het nu maïsopbrengst of ontbossing is, of olie-inventaris, zijn zo groot dat je ze niet met het menselijk oog kunt zien, omdat je een miljoen afbeeldingen tegelijk moet verwerken, 'Zegt Crawford. "Het zal uiteindelijk de manier veranderen waarop we de aarde bekijken, de manier waarop we erover nadenken, en de manier waarop we denken over het beheer ervan."