Krajowa Administracja Skarbowa

Jak stworzyć algorytm przeszukujący zasoby Internetu w poszukiwaniu podejrzanych ofert sprzedaży?

Konsultacji biznesowe zakończone!

Informacje z konsultacji biznesowych:

1.Protokół z dialogu technicznego


Opis wyzwania

Funkcjonariusze KAS śledzą każdego roku tysiące aukcji, ogłoszeń i stron w Internecie związanych z hazardem, przemytem papierosów, alkoholu, narkotyków i wielu innych nielegalnych towarów. Znalezienie ich wśród milionów stron jest zadaniem pochłaniającym ogromną miarę czasu. Znaczna część stron nie jest możliwa do znalezienia przy pomocy dostępnych wyszukiwarek internetowych. A gdyby tak wyszukać je na własną rękę?

Czy można stworzyć algorytm przeszukujący zasoby Internetu w poszukiwaniu podejrzanych ofert sprzedaży?
Jeśli tak, to będziesz mieć okazję współpracować z specjalistami w zakresie OSINT pracujących w Krajowej Administracji Skarbowej.
Podejmij wyzwanie! Przyczynisz się tym samym do zwiększenia efektywności ich pracy oraz lepszej ochrony terytorium RP.


Optymalne rozwiązanie to…

Optymalne rozwiązanie to aplikacja, która w sposób zautomatyzowany będzie identyfikować strony internetowe zawierające informacje podobne do zadanych.

Kluczowe funkcje to…

  • Aplikacja powinna umożliwiać stworzenie modelu strony wzorcowej, na podstawie zidentyfikowanych wcześniej stron.
  • Model tworzony powinien być ze stron, które podaje użytkownik. Użytkownik wprowadza strony internetowe, które uważa za istotne oraz te, które zawierają nieistotne dane.
  • Funkcja douczania systemu rozpoznającego strony w zakresie nowo gromadzonych danych (aktualizacja modelu).
  • Na bazie stworzonego modelu aplikacja wyszukuje strony podobne, zawierające zbliżone treści.
  • Moduł bazodanowy archiwizujący wyszukane wcześniej strony internetowe oraz pobrane z nich dane.
  • Aplikacja nie powinna opierać swojego działania wyłącznie na istniejących już wyszukiwarkach (tj. Google, Bing, Yandex, Duckduckgo, Yahoo itp.).
  • Narzędzie powinno pobierać automatycznie podstawowe informacje o zidentyfikowanych stronach np.: raport whois, raport Alexa, Google Analitics.
  • Aplikacja powinna posiadać własny system robotów sieciowych i przeszukiwać internet w sposób zanonimizowany.

Mierniki skuteczności wdrożenia

  • Skuteczność wyszukiwań >90% poprawnych wskazań

Link do zgłoszenia: http://bit.ly/govtechlab


Przydatne dokumenty:

  1. Załącznik nr 1 Regulamin przeprowadzenia dialogu technicznego IAS
  2. Załącznik nr 2 Opis przedmiotu zamówienia

Jeśli chcesz otrzymywać informacje o konkursach i programie GovTech Polska, zostaw swój adres mailowy: