Tagged: машинное обучение Toggle Comment Threads | Keyboard Shortcuts

  • Ruslan.Kayumov 12:43 on 13.08.2019 Permalink | Reply
    Метки: машинное обучение   

    https://towardsdatascience.com/a-gentle-introduction-to-exploratory-data-analysis-f11d843b8184

    Статья с понятными шагами для исследовательского анализа данных:
    1. What question are you trying to solve (or prove wrong)?
    Start with the simplest hypothesis possible. Add complexity as needed.

    2. What kind of data do you have?
    Is your data numerical, categorical or something else? How do you deal with each kind?

    3. What’s missing from the data and how do you deal with?
    Why is the data missing? Missing data can be a sign in itself. You’ll never be able to replace it with anything as good as the original but you can try.

    4. Where are the outliers and why should pay attention to them?
    Distribution. Distribution. Distribution. Three times is enough for the summary. Where are the outliers in your data? Do you need them or are they damaging your model?

    5. How can you add, change or remove features to get more out of your data?
    The default rule of thumb is more data = good. And following this works well quite often. But is there anything you can remove get the same results? Start simple. Less but better.

    По этим шагам наглядно разбирается датасет по пассажирам Титаника.
    Спойлер: в конце побеждает CatBoost.

     
  • Ruslan.Kayumov 22:32 on 06.09.2017 Permalink | Reply
    Метки: coursera, , машинное обучение, , , Яндекс   

    Начал прохождение специализации по Машинному обучению на курсере 

    К сожалению, набор на программу Анализ данных на степике прекратился (( Задумка была хорошая, насыщенная программа обучения от Института биоинформатики. В конце выдавался диплом о переподготовке, а прохождение программы было условием для поступление на магистратуру по биоинформатике. Есть вероятность, что закрыли временно.

    Сами курсы, из которых состоит программа, кстати, остались доступными, включая проверочные задания + бесплатно + по многим в конце выдается сертификат.
    От программы осталась очень полезная карта траектории прохождения курсов:

    Я проходил отдельные курсы. За лето прошел два, на программу записаться так и не успел. Но нет худа без добра. Желание продолжать постигать Data Science никуда не делось и потому решил пройти одну из самых популярных программ по сабжу — специализацию «Машинное обучение и анализ данных» на курсере от Яндекса и МФТИ. С 4 сентября приступил к первому курсу (всего 6 курсов и финальный проект). (More …)

     
c
compose new post
j
next post/next comment
k
previous post/previous comment
r
reply
e
edit
o
show/hide comments
t
go to top
l
go to login
h
show/hide help
shift + esc
cancel