GeoVista egy kínai kutatócsoport által fejlesztett nyílt forráskódú mesterséges intelligencia-modell, amely képeket elemez és az interneten keres releváns információkat, hogy meghatározza a fotók készítési helyét. Az MI rendszer teljesítménye eléri a kereskedelmi rendszerek szintjét, miközben új szintre emeli a lokalizációs feladatokat a webes keresés integrálásával.[^1]
GeoVista fejlesztése során a kutatók két fő eszközt integráltak: egy nagyítóeszközt, amely kiemeli a kép fontos részleteit, valamint egy webes keresőt, amely akár tíz internetes forrást is átvizsgál – például Tripadvisor, Instagram, Facebook, Pinterest és Wikipedia oldalakat. Az MI önállóan dönti el, mikor és hogyan használja ezeket az eszközöket.[^1]
„Az internetes keresés integrációja különbözteti meg GeoVista-t a korábbi modellektől” – hangsúlyozzák a fejlesztők.[^1]
Az MI modellt két szakaszban képezték: először egy felügyelt tanulási szakaszban 2000 példán keresztül sajátította el a gondolkodási mintákat és az eszközhasználatot, majd egy megerősítéses tanulás során 12 000 példával finomították a teljesítményét. A fejlesztők külön jutalmazási rendszert dolgoztak ki, amely magasabb jutalmat ad a pontosabb, például városszintű válaszokra.[^1]
A fejlesztők bemutatták a GeoBench nevű tesztadatbázist is, amely 1 142 nagy felbontású képet tartalmaz 66 országból és 108 városból, beleértve standard fotókat, panorámákat és műholdfelvételeket. Az adatbázis szigorúbb szűrési eljárással készült, így kizárja azokat a képeket, amelyek nem lokalizálhatók vagy túlságosan egyszerűek lennének.[^1]
GeoVista az ország szintjén 92,64%-os, tartományi szinten 79,60%-os, városi szinten pedig 72,68%-os pontosságot ért el. Panorámafotók esetében városszinten 79,49%-os pontosságot produkált, míg műholdképek esetében ez az érték 44,92% volt. Ezek az eredmények a kereskedelmi modellekkel, például Gemini-2.5-pro-val és GPT-5-tel összevetve is kiemelkedők.[^1]
Az MI modell válaszainak több mint fele három kilométeren belül találja el a pontos helyszínt, a medián eltérés 2,35 kilométer. Az összehasonlításban a kereskedelmi modellek valamivel pontosabbak, de a nyílt forráskódú alternatíva gyorsan zárkózik fel.[^1]
A kutatók nem foglalkoznak részletesen az adatvédelmi kérdésekkel, pedig ilyen technológiák könnyen a magánszféra veszélyeztetéséhez vezethetnek. Bárki, aki fotókat tölt fel az internetre, tudatában kell lennie annak, hogy egy MI-modell képes lehet a képek pontos helyszínének meghatározására.[^1]
GeoVista és a hozzá tartozó GeoBench mérföldkövet jelent az MI-alapú képlokalizációban. A technológia új kapukat nyit a földrajzi keresés terén, de egyben felelős adatkezelést és tudatos felhasználói magatartást is igényel.
[^1]: The Decoder (2025. 12. 07.). “Open-Source-KI GeoVista findet Aufnahmeorte von Fotos durch Zoom und Websuche”. Közzétéve [2025. 12. 07. 08:30:52 +0000].