Archiwum kategorii: Spotkania

Informacje o spotkaniach

Invitation – MLGDAŃSK #111 – Low-resource expressive text-to-speech using data augmentation

We would like to invite you to our first meeting after summer break!

Meeting will be held ONLINE, on Monday 2021.09.06, at 18:00

Our guest will be Tom Merrit (Amazon) https://www.linkedin.com/in/thomas-merritt-561a16101/

Title of presentation is:
Low-resource expressive text-to-speech using data augmentation

Abstract of Tom’s presentation:

While recent neural text-to-speech (TTS) systems perform remarkably well, they typically require a substantial amount of recordings from the target speaker reading in the desired speaking style.

In this work, we present a novel 3-step methodology to circumvent the costly operation of recording large amounts of target data in order to build expressive style voices with as little as 15 minutes of such recordings.

First, we augment data via voice conversion by leveraging recordings in the desired speaking style from other speakers.

Next, we use that synthetic data on top of the available recordings to train a TTS model.

Finally, we fine-tune that model to further increase quality. Our evaluations show that the proposed changes bring significant improvements over non-augmented models across many perceived aspects of synthesised speech.

We demonstrate the proposed approach on 2 styles (newscaster and conversational), on various speakers, and on both single and multi-speaker models, illustrating the robustness of our approach.

Link to the online meeting is:
https://meet.jit.si/MLGdansk_06092021_nb111

This speech won’t be recorded due to IP restrictions.

Zapowiedź – 102. spotkanie [ONLINE] – Sztuczna inteligencja w medycynie na przykładzie rozpoznawania złośliwości guzów nerek

Serdecznie zapraszamy do uczestnictwa ONLINE w 102. spotkaniu grupy MLGdańsk.

Spotkanie odbędzie się w poniedziałek, 15.03.2021, godz. 18:00

link do spotkania: https://meet.jit.si/MLGdansk_15032021_nb102
(uwaga: nowy link, korzystamy z jitsi)

Prelegentem będzie Aleksander Obuchowski z radiato.ai
https://radiato.ai/
https://www.linkedin.com/in/aleksander-obuchowski/

Temat prelekcji to:
Sztuczna inteligencja w medycynie na przykładzie rozpoznawania złośliwości guzów nerek

Parę słów od Prelegenta:
„Na prezentacji opowiemy o systemie do rozpoznawania złośliwości guzów nerek opracowanym przez grupę radiato.ai na Politechnice Gdańskiej.

Na jego przykładzie opowiemy też szerzej o sztucznej inteligencji w
medycynie, o architekturach, pre-processingu i metodach transferu
wiedzy.”

Serdecznie zapraszamy!

99. spotkanie [ONLINE] – Ile mleka produkuje krowa? R w środowisku produkcyjnym.

Spotkanie MLGdańsk #99 odbyło się 25 stycznia 2021 r.

Mateusz Bogdański, Senior Data Scientist z firmy Arla przedstawił prezentację pt.: „Ile mleka produkuje krowa? R w środowisku produkcyjnym

Mateusz przedstawił problem prognozowania produkcji mleka oraz jakie czynniki wpływają na wysokość produkcji (np. cena paszy). Następnie opisał model autoregresywny, służący do predykcji oraz usprawnienia jakie poczynił zespół w celu polepszenia dokładności prognozy.

Model został stworzony w języku R, natomiast obsługa modelu w środowisku produkcyjnym zapewniona została przy wykorzystaniu języka C#.

Na koniec prezentacji Mateusz opisał czego nauczył się zespół w trakcie realizacji projektu.

Link do nagrania:
?https://www.youtube.com/watch?v=m1-GrNgEaZ4

Link do slajdów:
?MLGdańsk #99 Mateusz Bogdański – Ile mleka produkuje krowa

97. spotkanie [ONLINE] – Wykrywanie obiektów na obrazie

Spotkanie MLGdańsk #97 odbyło się 14 grudnia 2020 r.

Karol Majek, właściciel firmy Cufix, prowadzący bloga deepdrive.pl oraz mentor w programie Udacity Self-Driving Car Nanodegree przedstawił prezentację pod tytułem „Wykrywanie obiektów na obrazach

Prezentacja jest ciekawym materiałem zarówno dla początkujących jak i zaawansowanych praktyków uczenia maszynowego.

Na wstępie Karol wyjaśnił zagadnienia oraz pojęcia związane z zadaniami detekcji oraz segmentacji obrazów. Następnie opisał najnowocześniejsze architektury sieci neuronowych, niektóre liczące zaledwie kilka miesięcy. Zainteresowani użyciem tych rozwiązań znajdą w nagraniu przegląd frameworków oraz narzędzi, które mogą być pomocne w tworzeniu systemów analizy obrazu.

Po prezentacji wywiązała się interesująca dyskusja na temat algorytmów, pojazdów autonomicznych oraz implementacji sieci neuronowych na urządzeniach mobilnych.

Link do nagrania:

?https://www.youtube.com/watch?v=xPimQUoW6aY

96. spotkanie [ONLINE] – MLOps: Data Science End to End

Spotkanie MLGdańsk #96 odbyło się 30.11.2020 r. #mlgdansk

Amadeusz Lisiecki, na co dzień pracujący w firmie Roche jako “MLOps Engineer” oraz działający w Hackerspace Pomorze przybliżył nam co kryje się pod zagadkowym akronimem MLOps. #mlops #machinelearning

Tytuł prelekcji Amadeusza to: „MLOps: Data Science End-to-End”.

MLOps to zbiór dobrych praktyk i narzędzi stosowanych w tworzeniu systemów informatycznych wykorzystujących uczenie maszynowe. Metodyka powstała na wzór popularnej obecnie oraz sprawdzonej metodyki DevOps.

Tworzenie jak i utrzymywanie rozwiązań software’owych używających metod uczenia maszynowego różni się od tworzenia standardowych produktów informatycznych. 

Opracowanie takich systemów wiąże się z wyzwaniami w sposobie ich wdrażania, monitorowania i utrzymywania. Typowymi problemami w cyklu ich życia są: reprodukowalność eksperymentów, trenowanie modeli, wydajne serwowanie modeli na produkcji. Wskazane jest oczywiście wdrożenie CI/CD oraz specyficznego dla MLOps procesu CT – continuous training.

Amadeusz poruszył te zagadnienia w swojej prelekcji. Przedstawił zarys metodyk MLOps oraz opisał pomocne narzędzia.

Pierwszym z przedstawionych narzędzi było Kedro, które umożliwia tworzenie wygodnych pipelinów dla zadań ML. Framework Kedro powstał w Pythonie, dobrze współpracuje z notatnikami Jupyter oraz zawiera przydatne abstrakcje wspomagające tworzenie różnych wariantów eksperymentów i modeli. 

Na koniec Amadeusza przedstawił Kubeflow, czyli zestaw narzędzi dedykowanych uczeniu maszynowemu dla Kubernetesa. Kubeflow znacznie upraszcza pracę ze złożonymi pipelinami w systemach ML, oraz umożliwia łatwe skalowanie systemów.

Prezentacja ze spotkania dostępna po tym linkiem.

Nagranie ze spotkania:
??https://www.youtube.com/watch?v=I7v9pl702Wo&feature=youtu.be

Dodatkowe materiały:

95. spotkanie [ONLINE] – EY Document Intelligence – NLP Solutions

Spotkanie MLGdańsk #95 odbyło się online 16 listopada 2020r.

Prelegentem był Adam Karwan (https://www.linkedin.com/in/akarwan), pracujący w EY GDS Poland w Warszawie.

Temat przedstawionej prelekcji to „EY Document Intelligence – NLP Solutions”.

Adam rozpoczął od przedstawienia EY oraz inicjatyw i projektów dotyczących sztucznej inteligencji w firmie.

Głównym tematem prezentacji było rozwiązanie EY Document Intelligence, służące do przetwarzania dokumentów oraz automatycznej klasyfikacji ich treści. Adam opisał architekturę systemu, oraz niektóre algorytmy opracowane przez inżynierów EY, które mają usprawnić analizę dokumentów. Algorytmy te, w szczególności polepszają jakość procesu OCR.

Następnie, zobaczyliśmy demo systemu oraz posłuchaliśmy o procesie anotacji dokumentów w celu stworzenia zbioru uczącego.

Na koniec Adam przybliżył nam ideę programu Trusted AI. Jest to sposób na prowadzenie projektów AI wdrażany przez EY. Proces ten ma zapewnić zintegrowane podejście do oceny, kwantyfikacji i monitorowania wpływu i wiarygodności systemów opartych o sztuczną inteligencję.

Prelekcja ta była przedstawiona też na konferencji Ghost Day (https://ghostday.pl)

Dodatkowe materiały:

94. spotkanie – Application of deep learning in medical genetics and cancer diagnostics

Spotkanie MLGdańsk #94 odbyło się online 19 października 2020 r.

Prelegentem był Tomasz Stokowy (https://www.uib.no/en/persons/Tomasz.Stokowy), pracujący na Uniwersytecie w Bergen.

Temat przedstawionej prelekcji to „Application of deep learning in medical genetics and cancer diagnostics”.

Tomasz rozpoczął prelekcję od wprowadzenia w zagadnienia związane z biologią i genetyką – znaczenie DNA, sposoby odczytywania DNA, postęp w technologii sekwencjonowania genomu ludzkiego. Dla zobrazowania tego postępu, warto przytoczyć fakt, że około 2000 roku koszt zsekwencjonowania ludzkiego genomu wynosił kilkaset milionów dolarów, obecnie wynosi niecałe tysiąc dolarów.

Innym ciekawym faktem, który mówi dużo o złożoności problemy analizy DNA jest to, że jeśli zbadamy DNA dwóch różnych osób, to różnice w sekwencji będą stanowiły zaledwie 0.1% całości genomu. A jeśli porównamy DNA człowieka i szympansa, to różnice zauważymy w zaledwie 1%. DNA człowieka jest sekwencją składającym się z 3 miliardów pozycji, które mogą przyjąć jedną z 4 wartości. Jest to rozmiar tak duży, że praca z takim materiałem jest bardzo trudna bez technik analizy danych.

W swojej prezentacji prelegent zaprezentował typy zmian, które mogą zachodzić w DNA oraz choroby jakie mogą powodować. Zmiana zaledwie jednej pozycji DNA może być przyczyną choroby. Wiele takich zmian w nieodpowiednich miejscach może prowadzić do nowotworów. Czynnikami, które mogą powodować takie zmiany (a co za tym idzie powodować większe ryzyko wystąpienia nowotworu) są m.in.: wiek, palenie papierosów, ekspozycja na promieniowanie UV czy czynniki dziedziczne.

W trakcie prezentacji, przedstawione zostały zadania, w których uczenie maszynowe może ułatwić pracę osób, zajmujących się genetyką. Takie zadania to np. wykrywanie pojedynczej zmiany w kodzie genetycznym oraz wykrywanie charakterystycznych  wzorców wielu zmian.

Przedstawiona została metoda Deep Variant, oparta o głębokie sieci neuronowe umożliwiająca identyfikację pojedynczej zmiany w genomie. W tej metodzie zadanie analizy genomu przekształcone jest do zadania analizy obrazu. Dzięki temu z powodzeniem można zastosować konwolucyjne sieci neuronowe. Dodatkowo oprócz samego genomu, metoda umożliwia dostarczenie dodatkowych cech, np. danych mówiących o jakości odczytu. Metoda Deep Variant zapewnia dokładniejsze wyniki niż inne stosowane rozwiązania.

Na koniec prezentacji Tomasz przedstawił swoje prace dotyczące wykrywania rzadkich chorób genetycznych. Prezentacja wywołała żywą dyskusję, w której poruszono tematy rynku biotechnologicznego w Polsce i na świecie, możliwości finansowania projektów, dostęp do danych, oraz możliwości stosowania technik uczenia maszynowego w biologii.

Jak widać, spotkanie oprócz poznania technicznych aspektów związanych z pracą prelegenta, było również interesującą lekcją „biologii stosowanej”.

Prezentacja ze spotkania dostępna po tym linkiem.

Dodatkowe materiały:
https://ai.googleblog.com/2017/12/deepvariant-highly-accurate-genomes.html
https://github.com/google/deepvariant
https://www.genome.gov/about-genomics/fact-sheets/Sequencing-Human-Genome-cost


93. Spotkanie [ONLINE] – A Framework for Understanding Unintended Consequences of Machine Learning

Nasze 93. spotkanie odbyło się online 5 października 2020 r.

Prelegentem był Robert Różański, który zreferował artykuł Harini Suresh’a i Johna V. Guttag’a „A Framework for Understanding Unintended Consequences of Machine Learning” (link).

Artykuł przedstawia model procesu budowania, ewaluacji i wdrażania modeli ML, skupiający się na potencjalnych źródłach niezamierzonych negatywnych konsekwencji, np. „algorythmic bias”.

Model ten ma ułatwić analizę ww. procesów pod kątem konsekwencji oraz dostarczyć wspólnych ram do opisu konkretnych problemów i rozwiązań. Ma on też ułatwić identyfikację elementów procesów, które można zmodyfikować aby poradzić sobie z różnymi niezamierzonymi konsekwencjami.

Prezentacja ze spotkania dostępna jest pod tym linkiem.

Serdecznie zapraszamy na nasze kolejne spotkania!

92. spotkanie MLGdańsk [ONLINE] – Robustness in Computer Vision

Nasze 92. spotkanie odbyło się online 21 września 2020 r.

Prelegentem był Sebastian Cygert realizujący doktorat na Politechnice Gdańskiej – Sebastian specjalizuje się w wykorzystywaniu głębokich sieci neuronowych w zadaniach analizy obrazu.

Zobaczyliśmy prezentację pt.: “Robustness in Computer Vision”, w której poruszone zostały tematy zdolności generalizacji przez sieci neuronowe, analizy ich działania oraz oceny poziomu generalizacji.

Podczas pierwszej części spotkania dowiedzieliśmy się o zastosowaniach aplikacyjnych, w których wysoka generalizacja jest istotna.

Przykładem takiego obszaru są systemy wizyjne w pojazdach autonomicznych, które powinny zachować wysoką dokładność w różnych warunkach pogodowych, o różnych porach dnia i roku, a nawet w różnych strefach klimatycznych.

W kolejnej części prelekcji zaprezentowane zostały liczne przykłady analizy decyzji podejmowanych przez sieci neuronowe.

Okazuje się, że sieci neuronowe często opierają swoje decyzje na cechach obrazu, które nie są widoczne dla człowieka. W licznych badaniach wykazano, że niewielka zmiana wartości pikseli (niewidoczna dla człowieka) może spowodować zmianę klasy zwracanej przez sieć.

W innym badaniu opisano, że sieć podczas podejmowania decyzji, zwraca uwagę nie tylko na sam obiekt ale i na otoczenie czy tło. Zmiana tła może prowadzić do zmiany decyzji sieci neuronowej. Kolejnym z zaprezentowanych przykładów, był system wykrywania zapalenia płuc ze zdjęć rentgenowskich. Analiza miejsc obrazu, które wpływają na decyzję sieci neuronowej, wykazała jednak, że sieć neuronowa opiera decyzje na znaczniku znajdującym się w rogu zdjęcia RTG.

W ostatniej część przedstawiono sposoby oceny generalizacji sieci neuronowych – na przykład wydzielając zbiór testowy z innego zbioru danych.

Sebastian omówił również sposoby polepszenia generalizacji sieci neuronowych np. poprzez odpowiednie techniki rozszerzania danych.

Prezentacja ze spotkania dostępna jest pod tym linkiem.

Serdecznie zapraszamy na nasze kolejne spotkania!

91. spotkanie [ONLINE] – Pakiet ‚platypus’ – detekcja obiektów i segmentacja obrazów w R w kilku linijkach kodu

Nasze 91. spotkaniu odbyło się online 9 września 2020 r.

Prelegentem był Michał Maj – Data Scientist z szczególnie ciekawym doświadczeniem w dziedzinie rozpoznawaniu obrazów i środowisku R.

Przedstawiona została prezentacja pt.: “platypus – R package for object detection and image segmentation”.

Prelekcję rozpoczęło przedstawienie projektu dotyczącego wykrywania schorzeń stawu biodrowego z użyciem technik deep learning. Jest to projekt realizowany w ramach programu e-Pionier.

W ramach projektu został zbudowany model klasyfikujący różne typy schorzeń. Wejściem do modelu było kilka tysięcy zdjęć formatu DICOM. Michał szczegółowo omówił w jaki sposób dane były zbierane, opisywane oraz przed jakimi wyzwaniami stanął zespół w trakcie tworzenia modeli.

Ostatecznie, zastosowano transfer learning z bazą w postaci modelu CheXNet (architektura DenseNet121).

Zasadniczą częścią prelekcji Michała, było przedstawienie biblioteki 'platypus’.

Jest to stworzony przez Michała pakiet R, ułatwiający tworzenie modeli Deep Learningowy dla zadań segmentacji obrazów i detekcji obiektów. Biblioteka ta posiada implementację modeli YOLOv3 oraz U-Net.

W tej części, prelegent opisał podstawowe typy problemów z dziedziny rozpoznawania obrazów, oraz sposoby ich rozwiązywania z wykorzystaniem powyższych architektur.

Michał przedstawił również przykłady w R, jak użyć biblioteki 'platypus’ w akcji.

Prezentacja ze spotkania jest dostępna tutaj

Biblioteka 'platypus’ do pobrania z:
https://github.com/maju116/platypus

Wkrótce udostępnimy również nagranie z tej prelekcji.

Serdecznie zapraszamy na nasze kolejne spotkania!

4-lata MLGdańsk – spotkanie Lato 2020

W poniedziałek 3.08 spotkaliśmy się po raz pierwszy „na żywo” od marca. Tym razem nie mieliśmy prelekcji, lecz spotkaliśmy się w nieformalnej atmosferze w Pubie Polufka.

Było to 90. spotkanie grupy, ale przede wszystkim 4. urodziny MLGdańsk! Mieliśmy okazję do porozmawiania na temat bieżących wydarzeń, projektów oraz planów.

Spotkania grupy powrócą już we wrześniu. Wszystko wskazuje na to, że nadal w wydaniu online.

Serdecznie zachęcamy do kontaktu chętnych do przedstawienia swojego tematu na forum grupy. Kontakt do nas jest tutaj.

Życzymy wszystkim dobrych, zdrowych wakacji. Do zobaczenia na łączach już niebawem!

89. spotkanie MLGdańsk – A Maritime Anomaly Detector using Neural Nets

Nasze 89. spotkaniu odbyło się online 29 czerwca 2020 r.

Prelegentem był Tadeusz Balcer z firmy DNV GL – firma ta działa jako towarzystwo klasyfikacyjne w branży morskiej oraz akredytowana jednostka certyfikująca w innych branżach.

Przedstawiona została prezentacja pt.: “GeoTrackNet – A Maritime Anomaly Detector using Probabilistic Neural Network Representation of AIS Tracks and A Contrario Detection”. Tytuł prelekcji to również tytuł publikacji, którą omawiał Tadeusz. Rozwiązanie przedstawione w artykule wykorzystuje głębokie sieci neuronowe do wykrywania anomalii w ruchu statków na morzu.

Prezentacja zaczęła się od omówienia systemu AIS (Automatic Identification System), który wykorzystywany jest przez statki do nadawania informacji takich jak położenie, prędkość, nazwa statku czy port docelowy. Tadeusz szeroko omówił zastosowanie systemu oraz wymogi w stosowaniu systemu na statkach. Omówił kwestie techniczne oraz nowe rozwiązania takie jak satelitarny AIS.

Główna część prelekcji została poświęcona omówieniu systemu, opartego o sieci neuronowe. Omówione zostały dane wykorzystane w uczeniu sieci. Zaprezentowane został sposób reprezentacji wejścia, który zawierał informacje o położeniu, prędkości oraz kursie statków. Następnie omówiona została architektura oparta o rekurencyjne sieci neuronowe LSTM z zastosowaniem podejścia wariacyjnego (Variational Recurrent Neural Network).

W ostatniej części prezentacji omówione zostały wyniki, w szczególności interpretacja anomalii w ruchu statków znalezionych przez system. Tadeusz zaprezentował porównanie systemu z tymi opartymi o klasyczne algorytmy. Pokazał również ciekawe przypadki w działaniu systemu – np. wykrycie kutra rybackiego pływającego w nieregularny sposób w celu poszukiwania ryb.

Na koniec spotkania wywiązała się ciekawa dyskusja na temat omawianego problemu oraz ogólnie branży morskiej, podczas której nasz prelegent przedstawił wiele ciekawostek związanych z jego pracą zawodową.

Prezentacja ze spotkania jest dostępna tutaj: https://github.com/mlgdansk/meetings/tree/master/MLGdansk89

Materiały uzupełniające:

Serdecznie zapraszamy na nasze kolejne spotkania!

88. spotkanie MLGdańsk – Introduction to causal discovery and inference

Spotkanie odbyło się 15.06.2020 online poprzez Skype.

Na spotkaniu wysłuchaliśmy prelekcji Roberta Różańskiego pod tytułem „Introduction to causal discovery and inference„.

Prelegent omówił podstawowe zagadnienia związane z budowaniem modeli przyczynowo-skutkowych na podstawie danych obserwacyjnych oraz przewidywaniem efektów interwencji.

W pierwszej części wyjaśnił główne problemy związane z traktowaniem tradycyjnych modeli statystycznych lub ML jako modeli przyczynowo-skutkowych. Następnie omówił związki między założeniami dotyczącymi badanego systemu a tym, co możemy powiedzieć o jego strukturze na podstawie danych obserwacyjnych.

Druga część prezentacji była poświęcona przewidywaniu efektów
interwencji. Robert omówił kryteria doboru zmiennych „backdoor” i
„frontdoor” oraz wykorzystanie zmiennych instrumentalnych. Omówił również podstawowe metody estymacji efektów: stratyfikację, „matching”, modelowanie mechanizmu przypisywania interwencji oraz modelowanie powierzchni reakcji.

Prezentacja, wraz z bibliografią jest dostępna tutaj:
https://github.com/mlgdansk/meetings/blob/master/MLGdansk88_2020.06.15_RobertRozanski_CasualDiscoveryAndInference.pdf

Serdecznie zapraszamy na kolejne spotkania MLGdańsk!