Temat prelekcji to: „Rzeczywistość projektów Data Science”
Parę słów od Prelegenta:
„W oparciu o doświadczenia deepsense.ai z blisko 100 zrealizowanych projektów z zakresu analizy danych i uczenia maszynowego, przybliżymy napotykane wyzwania i problemy, które rzadko przypominają te z konkursów Kaggle’a.”
Spotkanie ma na celu podsumowanie roku, omówienie planów grupy i ogólnie pogaduchy na ciekawe tematy (liczymy na głos uczestników spotkania!).
Jeżeli macie propozycję co możemy omówić lub / i jakieś pomysły / propozycje na przyszłość, proszę o kontakt lub o zabranie głosu na spotkaniu właśnie 😉
Temat prelekcji to: O badaniach klinicznych, telemedycynie i COVID-19
Prelekcja Łukasza to krótkie wprowadzenie do problematyki badań klinicznych na przykładzie rozwiązań telemedycznych w obserwacji pacjentów z long-COVID.
Temat prelekcji to: Model agentowy epidemii covid-19 grupy MOCOS
Prelekcja stanowić będzie opis koncepcji i implementacji modelu agentowego epidemii covid-19 opracowanego przez grupę MOCOS z Wrocławia.
Model zaimplementowany jest w języku Julia i oprócz generowania prognoz rozwoju epidemii dostarcza informacji na temat najbardziej prawdopodobnych wartości parametrów, które mogą być interpretowane jako opisujące aktualną skuteczność walki z epidemią.
Zapraszamy do udziału w meetupie “Data Science po godzinach vol. II”, organizowanym przez szkołę programowania infoShare Academy. Tematem przewodnim będzie AI i Machine Learning.
MLGdańsk jest partnerem tego wydarzenia.
Meetup odbędzie się ONLINE w środę 27 października, w godz. 18-20.
18:10 ➡ Machine Learning vs Machine Discovery. Czym dzisiaj jest sztuczna inteligencja? dr Mateusz Bonecki – Chief Innovation Officer w DAC.digital
Wystąpienie poświęcone będzie drodze, jaką przeszła sztuczna inteligencja od obwieszczonej ponad dekadę temu przez Chrisa Andersona (Wired) detronizacji nauki teoretycznej przez data science.
18:55 ➡ United Data Forces of OLX – segmenting pros like a pro Tomasz Jamiński / Head of Data Science w OLX Group dr Piotr Sobczyk / Senior Data Scientist w OLX Group Mikołaj Szal / Data Scientist w OLX Group
W tym wystąpieniu głos zabierze team Data Science w OLX-ie. Ciekawe biznesowe case study: Panowie opowiedzą, jak połączyli siły Data Science, UX Research oraz Product Analytics w celu dostarczenia behawioralnej segmentacji sprzedawców.
Po wszystkich prelekcjach przewidziane są sesje Q&A i networkingowe, a na koniec konkurs z nagrodami! Data Science po Godzinach poprowadzi Paweł Alicki, training architect w infoShare Academy od lat związany z branżą IT pasjonat Data Science.
Temat prelekcji to: Mitigating bias with Targeted Data Augmentations
Parę słów od Prelegentki: „Czym jest tendencyjność w uczeniu maszynowym i na jakim etapie może zostać niechcący wprowadzona?
Jak wykrywać tendencyjność i jak sobie z nią radzić?
Podczas prezentacji przedstawię swoje badania realizowane w ramach grantu „Wykrywanie i zmniejszanie wpływu tendencyjności danych za pomocą objaśnialnej sztucznej inteligencji ” na przykładzie klasyfikacji znamion skórnych.”
Title of presentation is: Low-resource expressive text-to-speech using data augmentation
Abstract of Tom’s presentation:
While recent neural text-to-speech (TTS) systems perform remarkably well, they typically require a substantial amount of recordings from the target speaker reading in the desired speaking style.
In this work, we present a novel 3-step methodology to circumvent the costly operation of recording large amounts of target data in order to build expressive style voices with as little as 15 minutes of such recordings.
First, we augment data via voice conversion by leveraging recordings in the desired speaking style from other speakers.
Next, we use that synthetic data on top of the available recordings to train a TTS model.
Finally, we fine-tune that model to further increase quality. Our evaluations show that the proposed changes bring significant improvements over non-augmented models across many perceived aspects of synthesised speech.
We demonstrate the proposed approach on 2 styles (newscaster and conversational), on various speakers, and on both single and multi-speaker models, illustrating the robustness of our approach.
Zapraszamy do udziału w meetupie “Data Science po godzinach”, organizowanym przez szkołę programowania infoShare Academy. Wydarzenie odbędzie się 1 września i jest w pełni zdalne.
MLGdańsk jest partnerem tego wydarzenia. Jednym z prelegentów będzie Marcin Zadroga.
Meetup odbędzie się ONLINE w środę 1 września, w godz. 14-17.
Toucan Eye – przygoda z detekcją i rozpoznawaniem tekstu // Krzysztof Bork Ceszlak – Machine Learning Project Manager / Toucan Systems
„Prezentacja dotyczyć będzie rzeczywistego problemu jakim jest detekcja i rozpoznawanie tekstu. Badania prowadzone były na potrzeby urządzenia wspomagającego osoby niedowidzące w życiu codziennym. Przedstawię historię rozwiązania od złożonych, wieloetapowych algorytmów po głębokie sieci neuronowe. Na podstawie doświadczeń pokażę jak jednocześnie satysfakcjonujące oraz brutalne może być uczenie maszynowe.”
Hydraulika w Pythonie, czyli data pipelines i przetwarzanie strumieni danych // Rafał Styrylski – Software Developer and Machine Learning Engineer / Genesis Global Limited
„Python słynie z narzędzi pozwalających tworzyć najbardziej wyszukane modele uczenia maszynowego, jednak żeby móc działać, modele potrzebują odpowiednio przygotowanych danych. Zapewnienie odpowiedniego przepływu i procesów transformacji danych jest często pierwszym co musimy zrobić, by nasz model mógł działać w prawdziwym świecie. Podczas prezentacji zademonstruje w jaki sposób można szybko stworzyć i uruchomić procesy przetwarzania danych z wykorzystaniem Pythona, narzędzi Apache i usług Google Cloud Platform”
Analiza szeregów czasowych z wykorzystaniem Pythona // Marcin Zadroga – Data Scientist // Senior Analytics Solutions Developer w DNV
„Jednym z ciekawszych i coraz popularniejszych zagadnień z zakresu Data Science jest analiza szeregów czasowych. Podczas prezentacji przybliżymy narzędzia oraz zaprezentujemy use-case dotykający tego zagadnienia. Na prezentacji dowiesz się co to trend, sezonowość i jak 'klasyczne’ metody analizy szeregów czasowych mają się do analiz i predykcji stworzonych z użyciem sieci neruonowych.”
Po wszystkich prelekcjach przewidziane są sesje Q&A i networkingowe, a na koniec Kahoot z nagrodami edukacyjnymi. “Data Science po godzinach” poprowadzi Paweł Alicki, training architect w infoShare Academy od lat związany z branżą IT pasjonat Data Science.
Temat prelekcji to: Mój projekt potrzebuje 6 GPU do wtorku! – współdzielenie GPU z pomocą narzędzia TensorHive
Parę słów od Prelegenta:
„Obok potężnych zbiorów danych i pojemnych modeli, tym co napędza nasze projekty ML jest moc obliczeniowa. Inwestujemy w wydajne serwery z GPU, ale jak dobrze zorganizować zespół, by te cenne zasoby obliczeniowe były odpowiednio wykorzystane?
Znanym rozwiązaniem są systemy kolejkowe, ale nie dają one możliwości interaktywnej pracy z GPU, które na jakiś czas chcielibyśmy mieć tylko dla siebie. Alternatywą są systemy rezerwacji, a wśród nich open source’owe narzędzie TensorHive (https://github.com/roscisz/TensorHive/), które rozwijamy i wykorzystujemy na Wydziale ETI Politechniki Gdańskiej.
Chciałbym nie tylko zareklamować nasz projekt, ale również podzielić się z grupą ML Gdańsk ogólnymi doświadczeniami zebranymi na PG i w społeczności korzystającej z TensorHive, związanymi ze współdzieleniem mocnych serwerów z GPU przez nieduże zespoły robocze.”