Krajowa Administracja Skarbowa

Jak stworzyć algorytm przeszukujący zasoby Internetu w poszukiwaniu podejrzanych ofert sprzedaży?

Konsultacji biznesowe zakończone!

Informacje z konsultacji biznesowych:

1.Protokół z dialogu technicznego


Opis wyzwania

Funkcjonariusze KAS śledzą każdego roku tysiące aukcji, ogłoszeń i stron w Internecie związanych z hazardem, przemytem papierosów, alkoholu, narkotyków i wielu innych nielegalnych towarów. Znalezienie ich wśród milionów stron jest zadaniem pochłaniającym ogromną miarę czasu. Znaczna część stron nie jest możliwa do znalezienia przy pomocy dostępnych wyszukiwarek internetowych. A gdyby tak wyszukać je na własną rękę?

Czy można stworzyć algorytm przeszukujący zasoby Internetu w poszukiwaniu podejrzanych ofert sprzedaży?
Jeśli tak, to będziesz mieć okazję współpracować z specjalistami w zakresie OSINT pracujących w Krajowej Administracji Skarbowej.
Podejmij wyzwanie! Przyczynisz się tym samym do zwiększenia efektywności ich pracy oraz lepszej ochrony terytorium RP.


Optymalne rozwiązanie to…

Optymalne rozwiązanie to aplikacja, która w sposób zautomatyzowany będzie identyfikować strony internetowe zawierające informacje podobne do zadanych.

Kluczowe funkcje to…

 • Aplikacja powinna umożliwiać stworzenie modelu strony wzorcowej, na podstawie zidentyfikowanych wcześniej stron.
 • Model tworzony powinien być ze stron, które podaje użytkownik. Użytkownik wprowadza strony internetowe, które uważa za istotne oraz te, które zawierają nieistotne dane.
 • Funkcja douczania systemu rozpoznającego strony w zakresie nowo gromadzonych danych (aktualizacja modelu).
 • Na bazie stworzonego modelu aplikacja wyszukuje strony podobne, zawierające zbliżone treści.
 • Moduł bazodanowy archiwizujący wyszukane wcześniej strony internetowe oraz pobrane z nich dane.
 • Aplikacja nie powinna opierać swojego działania wyłącznie na istniejących już wyszukiwarkach (tj. Google, Bing, Yandex, Duckduckgo, Yahoo itp.).
 • Narzędzie powinno pobierać automatycznie podstawowe informacje o zidentyfikowanych stronach np.: raport whois, raport Alexa, Google Analitics.
 • Aplikacja powinna posiadać własny system robotów sieciowych i przeszukiwać internet w sposób zanonimizowany.

Mierniki skuteczności wdrożenia

 • Skuteczność wyszukiwań >90% poprawnych wskazań

Link do zgłoszenia: http://bit.ly/govtechlab


Przydatne dokumenty:

 1. Załącznik nr 1 Regulamin przeprowadzenia dialogu technicznego IAS
 2. Załącznik nr 2 Opis przedmiotu zamówienia

Jeśli chcesz otrzymywać informacje o konkursach i programie GovTech Polska, zostaw swój adres mailowy: