Zaproszenie do konsultacji biznesowych!

Zapraszamy wszystkich chętnych innowatorów na konsultacje biznesowe, mające na celu uzyskanie informacji dotyczących planowanego zamówienia publicznego polegającego na opracowaniu systemu automatycznego rozpoznawania mowy i mówcy, w ramach drugiej edycji GovTech Polska.

 

22 maja 2019, Kraków, Konferencja Impact CEE / Cracow Tech Week


Opis wyzwania

Kancelaria Senatu ma obowiązek zapewnić transmisje z posiedzeń Senatu oraz komisji senackich, wraz z zapisami stenograficznymi z tych posiedzeń na swojej stronie internetowej. Tylko podczas ostatniej, VII kadencji zebrało się ponad 9,5 tysiąca stron zapisów, co nie sprzyja szybkiemu odnajdywaniu informacji.

 

Szukamy rozwiązania, które pozwoli opracować przystępniejszą formę transmisji video z obrad oraz ułatwi odnajdywanie nagrań poszczególnych wypowiedzi senatorów. Formę, która umożliwi dodanie linków z nagraniem do konkretnego miejsca w stenopisie, co sprawi, że opisy mówców w transmisji video byłyby trafniejsze i szybciej dostępne.

 

Docelowo pomogłoby to w opracowaniu szczegółowego panelu do nawigacji po nagraniu video. Automatyzacja procesów wewnętrznych ułatwi i przyspieszy pracę nad transmisją i dokumentacją z posiedzeń Senatu i komisji senackich. Wprowadzenie sztucznej inteligencji i automatyzacja procesów wewnętrznych pomoże wyeliminować tzw. błędy ludzkie. Rozpoznawanie mówców na podstawie głosu i obrazu oraz narzędzi do wspomagania transkrypcji wypowiedzi wprowadzi szereg usprawnień i służyć będzie do wyeliminowania ryzyk związanych z procesem.


Optymalne rozwiązanie to…

Optymalne rozwiązanie to narzędzie wspomagający pracę stenotypistek oraz operatorów TV, które pozwoli szybko i automatycznie identyfikować mówców na podstawie analizy dźwięku (głosu), obrazów video oraz wykonywać transkrypcję mowy na tekst.

 

Kluczowe funkcje systemu:

  • Rozpoznawanie mówcy na podstawie nagrania audio
  • Rozpoznawanie mówcy na podstawie nagrania video
  • Przyjmowanie jako dane wejściowe nagrań audio, video lub zdjęć i zwracanie wyniku w formacie pliku XML o podanej strukturze
  • Funkcja uczenia się na podstawie nowo gromadzonych danych (aktualizacja modelu)

 

Wskaźniki skuteczności wdrożenia:

 

Wskaźniki w zakresie rozpoznawania mówców:

  • bezbłędna, całkowicie automatyczna identyfikacja senatorów (dostępne próbki głosu i zdjęcia)
  • półautomatyczna identyfikacja uprzednio rozpoznanych gości, np. przedstawicieli rządu (dostępne próbki głosu i zdjęcia)
  •  szybkie zgłoszenie braku danych gości wypowiadających się pierwszy raz i utworzenie nowego powiązania głosowego (brak próbek głosu i zdjęć)

 

Wskaźniki w zakresie transkrypcji:

  • podział tekstu uwzględniający zmiany mówców, także w sytuacji nakładających się na siebie wypowiedzi (tj. rozróżnianie mówców mówiących jednocześnie)
  • trafna transkrypcja mowy, z względnie logicznymi podziałami na akapity, zdania (tj. wykorzystująca cechy prozodyczne wypowiedzi i/lub inne elementy modeli akustycznych i językowych do odpowiedniej segmentacji przetworzonego tekstu z użyciem znaków interpunkcyjnych; niepożądany jest zapis typu słowotok)
  • trafne rozpoznawanie i zapisywanie wyrażeń charakterystycznych dla użyć specjalistycznych (m.in. prawo, ekonomia, polityka), rozpoznawanie akronimów i popularnych wyrażeń obcojęzycznych (gł. łacina i angielski). System powinien uczyć się na podst. nanoszonych poprawek, zarówno w zakresie rozpoznawania mówców na podst. głosu/obrazu, jak i w zakresie transkrypcji

Jesteś gotów podjąć wyzwanie?

Zacznij od skonsultowania pomysłu Kancelarii Senatu!

Zapraszamy wszystkich chętnych innowatorów na konsultacje biznesowe, mające na celu uzyskanie informacji dotyczących planowanego zamówienia publicznego polegającego na opracowaniu Systemu automatycznego rozpoznawania mowy i mówcy, w ramach drugiej edycji GovTech Polska.

 

22 maja 2019, Kraków, Konferencja Impact CEE / Cracow Tech Week

 

Zgłoszenia można składać:

  • Osobiście, w siedzibie Zamawiającego lub u przedstawiciela Zamawiającego w miejscach i terminach jakie Zamawiający publikować będzie na swojej stronie internetowej;
  • Za pośrednictwem poczty elektronicznej na adres govtech@senat.gov.pl;
  • Pocztą na adres: Kancelaria Senatu, Ul. Wiejska 6/8, 00-902 Warszawa z dopiskiem: „Dialog techniczny na opracowanie Systemu automatycznego rozpoznawania mowy i mówcy”

Link do zgłoszenia: http://bit.ly/govtechlab


Przydatne dokumenty:

  1. Ogłoszenie o zamiarze przeprowadzenia konsultacji biznesowych (dialogu technicznego)
  2. Regulamin przeprowadzania konsultacji biznesowych (dialogu technicznego)
  3. Wstępne założenia konkursu na opracowanie systemu automatycznego rozpoznawania mowy i mówcy

Jeśli chcesz otrzymywać informacje o konkursach i programie GovTech Polska, zostaw swój adres mailowy: