Tagged: машинное обучение Toggle Comment Threads | Keyboard Shortcuts

  • Ruslan.Kayumov 11:23 on 11.08.2023 Permalink | Reply
    Метки: , Reinforcement Learning, ВШЭ, машинное обучение,   

    Завершил магистратуру ВШЭ "Машинное обучение и высоконагруженные системы" 

    Вот и все, магистратура ВШЭ завершена!

    ФКН, Прикладная математика и информатика, программа «Машинное обучение и высоконагруженные системы». Спасибо, было насыщенно и интересно.

    В качестве магистерской диссертации разработка клиент-серверного приложения для ребалансировки инвестиционного портфеля с помощью методов Deep Reinforcement Learning.

    Пара скринов с защиты

    Внешний вид приложения:

    Структура приложения: (More …)

     
  • Ruslan.Kayumov 12:19 on 31.03.2021 Permalink | Reply
    Метки: AutoML, , машинное обучение   

    50 оттенков AutoML 

    Создатель ODS популярно объясняет про AutoML. Вокруг сабжа много мифов и попыток объять. Здесь похоже на действительно систематизированный подход. Кажется, полезно будет посмотреть даже просто вкатывающимся в DS и им сочувствующим, чтобы понять задачи, стоящими перед датасатанистом и прочуствовать точки пересечения ресерча, бизнеса и инженерии.

     
  • Ruslan.Kayumov 12:43 on 13.08.2019 Permalink | Reply
    Метки: машинное обучение   

    https://towardsdatascience.com/a-gentle-introduction-to-exploratory-data-analysis-f11d843b8184

    Статья с понятными шагами для исследовательского анализа данных:
    1. What question are you trying to solve (or prove wrong)?
    Start with the simplest hypothesis possible. Add complexity as needed.

    2. What kind of data do you have?
    Is your data numerical, categorical or something else? How do you deal with each kind?

    3. What’s missing from the data and how do you deal with?
    Why is the data missing? Missing data can be a sign in itself. You’ll never be able to replace it with anything as good as the original but you can try.

    4. Where are the outliers and why should pay attention to them?
    Distribution. Distribution. Distribution. Three times is enough for the summary. Where are the outliers in your data? Do you need them or are they damaging your model?

    5. How can you add, change or remove features to get more out of your data?
    The default rule of thumb is more data = good. And following this works well quite often. But is there anything you can remove get the same results? Start simple. Less but better.

    По этим шагам наглядно разбирается датасет по пассажирам Титаника.
    Спойлер: в конце побеждает CatBoost.

     
  • Ruslan.Kayumov 22:32 on 06.09.2017 Permalink | Reply
    Метки: coursera, , машинное обучение, , , Яндекс   

    Начал прохождение специализации по Машинному обучению на курсере 

    К сожалению, набор на программу Анализ данных на степике прекратился (( Задумка была хорошая, насыщенная программа обучения от Института биоинформатики. В конце выдавался диплом о переподготовке, а прохождение программы было условием для поступление на магистратуру по биоинформатике. Есть вероятность, что закрыли временно.

    Сами курсы, из которых состоит программа, кстати, остались доступными, включая проверочные задания + бесплатно + по многим в конце выдается сертификат.
    От программы осталась очень полезная карта траектории прохождения курсов:

    Я проходил отдельные курсы. За лето прошел два, на программу записаться так и не успел. Но нет худа без добра. Желание продолжать постигать Data Science никуда не делось и потому решил пройти одну из самых популярных программ по сабжу — специализацию «Машинное обучение и анализ данных» на курсере от Яндекса и МФТИ. С 4 сентября приступил к первому курсу (всего 6 курсов и финальный проект). (More …)

     
c
compose new post
j
next post/next comment
k
previous post/previous comment
r
reply
e
edit
o
show/hide comments
t
go to top
l
go to login
h
show/hide help
shift + esc
cancel