Последние обновления Страница 2 Toggle Comment Threads | Keyboard Shortcuts

  • Ruslan.Kayumov 12:43 on 13.08.2019 Permalink | Reply
    Метки:   

    https://towardsdatascience.com/a-gentle-introduction-to-exploratory-data-analysis-f11d843b8184

    Статья с понятными шагами для исследовательского анализа данных:
    1. What question are you trying to solve (or prove wrong)?
    Start with the simplest hypothesis possible. Add complexity as needed.

    2. What kind of data do you have?
    Is your data numerical, categorical or something else? How do you deal with each kind?

    3. What’s missing from the data and how do you deal with?
    Why is the data missing? Missing data can be a sign in itself. You’ll never be able to replace it with anything as good as the original but you can try.

    4. Where are the outliers and why should pay attention to them?
    Distribution. Distribution. Distribution. Three times is enough for the summary. Where are the outliers in your data? Do you need them or are they damaging your model?

    5. How can you add, change or remove features to get more out of your data?
    The default rule of thumb is more data = good. And following this works well quite often. But is there anything you can remove get the same results? Start simple. Less but better.

    По этим шагам наглядно разбирается датасет по пассажирам Титаника.
    Спойлер: в конце побеждает CatBoost.

     
  • Ruslan.Kayumov 15:46 on 10.03.2018 Permalink | Reply
    Метки: , матанализ,   

    Пошаговая инструкция для нахождения числа членов последовательности 

    Эту инструкцию писал в комментариях к бесплатному курсу stepik Введение в математический анализ. Как я понял, инструкция оказалась полезной, т.к. продолжает собирать лайки и благодарности. Задача простая — из категории самых первых шажков в матанализе. Но часто спотыкание на таких задачах и приводит к забрасыванию всего курса. В частности, инструкцию написал, когда увидел такой комментарий к задаче: «Введение в математический анализ, первое задание и у меня сразу ступор. Мой внутренний начинающий математик забился в угол и заплакал :(«

    ЗАДАЧА:

    Найдите число членов последовательности $$x_n = {2n — 1\over 4n + 5}$$ , лежащих вне интервала $$({1\over 2} — {1\over 1000}, {1\over 2} + {1\over 1000})$$

     
     
    ИНСТРУКЦИЯ ПО РЕШЕНИЮ:
    Инструкция дается для обучающихся с учетом просмотра видео из курса, но подойдет и в том случае, если Вы почитали хоть что-то по теме (More …)

     
  • Ruslan.Kayumov 21:48 on 06.02.2018 Permalink | Reply
    Метки: ,   

    Простая учебная задача проверки орфографии на Python 

    В прошлом году согласился стать модератором на популярном курсе по программированию на Python (рекомендую, замечательный бесплатный курс). Мне это нужно в первую очередь для того, чтобы самому Python не забывать. Потому что без практики кодинг довольно быстро приходит в увядание и от элегантного pythonic way вскоре остаются одни паскалевские операторы 🙂

    В этой публикации я хочу оставить разбор одной простой задачки курса. Опять же делаю это для себя в целях быстрого воскрешения знаний. Просто так вышло, что меня попросили объяснить решение в курсе, что я и сделал. Оно у меня таким образом уже полностью выложено, но в закромах курса. Хотелось вы вывести его на белый свет.

    Итак, задача звучит так: (More …)

     
  • Ruslan.Kayumov 21:59 on 11.01.2018 Permalink | Reply  

    Todoist помог посмотреть на производительность в 2017 году 

    Есть такой сервис для планирования задач Todoist.com
    Я плотно использовал его в 2015-ом, в 2016-ом переходил на другие варианты (этот бесконечный поиск средства планирования). И вот в 2017-ом вернулся к его использованию. Прежде всего, потому что он очень прост в использовании, все делается с доступностью в один-два клика и минимум движений. Пожалуй, это самое важное качество для подобного сервиса.

    В общем, прислал он мне недавно отчет по использованию. Довольно занятно посмотреть на прошедший год через такую призму ))

    Надо умножить на 2 эти числа, т.к. по следующему скрину станет ясно, что в тудуист я вернулся только в середине года (More …)

     
  • Ruslan.Kayumov 07:08 on 27.10.2017 Permalink | Reply
    Метки: AMPPS, MySQL   

    Быстрый запуск MySQL под Windows 

    (в моем случае было нужно для выполнения упражнений по SQL)

    1. Скачиваем и устанавливаем бесплатный локальный сервер AMPPS — https://www.ampps.com/downloads
    2. На своем ПК в браузере заходим на http://localhost/ampps/
    3. В панели слева находим DB Tools -> phpMyAdmin, устанавливаем (Install Now, со всем соглашаемся)
    4. Заходим в браузере на http://127.0.0.1/myadmin/index.php
    5. Для доступа используем логин root, пароль mysql. Профит.
     
  • Ruslan.Kayumov 13:58 on 17.10.2017 Permalink | Reply
    Метки: ,   

    На первом курсе в вузе был факультативный курс по программированию ilab, там я фактически и научился программировать. Но самые нужные знания мне дали онлайн-курсы на stepik.org. В работе мне часто помогают конспекты

    Александр Кукуев, выпускник МФТИ, стажер, а затем программист в Mail.ru, статья
     
  • Ruslan.Kayumov 02:56 on 13.10.2017 Permalink | Reply  

    Некий Антон из обсуждения на stepik.org:
    «Тренд, который будет существовать в 20е такой — либо ты автоматизируешь, либо тебя автоматизируют»

    Трудно не согласиться.

     
  • Ruslan.Kayumov 21:41 on 26.09.2017 Permalink | Reply
    Метки:   

    Сегодня празднуем 8-летие OpenTraders ))

    http://project.opentraders.ru/41301.html

     
  • Ruslan.Kayumov 21:38 on 25.09.2017 Permalink | Reply
    Метки:   

    Hype cycle на графиках финансовых рынков

    http://strategy.opentraders.ru/41293.html

    Здесь только картинки выложу

    Оригинальный родительский Hype cycle от Gartner для технологий:

    Переделываем его под рынки:

    Пример работы:

     
  • Ruslan.Kayumov 16:42 on 20.09.2017 Permalink | Reply
    Метки: , wordpress, плагины wordpress   

    Как вставить код Jupyter в блог WordPress? 

    1) Устанавливаем и активируем плагин https://ru.wordpress.org/plugins/oembed-gist/

    2) Сохраняем наш notebook в файл *.ipynb, открываем его текстовым редактором, копируем содержимое файла

    3) Идем на https://gist.github.com

    4) Вставляем код из буфера, заполняем поле с названием файла, указываем расширение *.ipynb

    5) Нажимаем кнопку Create public gist, код появляется на гите, ссылку на код теперь просто вставляем в наш пост на WP, после публикации ссылка автоматически подхватится и код опубликуется

    Пример, как будет выглядеть, можно посмотреть по ссылке: http://kayumov.ru/401/

     
  • Ruslan.Kayumov 15:49 on 20.09.2017 Permalink | Reply
    Метки: IPython, matplotlib, , , градиентный спуск,   

    Реализация простейшего примера градиентного спуска на IPython 

    Ниже пример реализации на IPython градиентного спуска в рамках прохождения курса на Курсере для простой функции одной переменной с подробными комментариями. Т.е. вообще-то тема градиента предполагает хотя бы функцию двух переменных. Но начать, считаю, надо с одной переменной. Затем, когда суть понятна, тогда уже не помешает сделать решение для двух переменных, соответственно с трехмерными графиками. (More …)

     
  • Ruslan.Kayumov 22:32 on 06.09.2017 Permalink | Reply
    Метки: coursera, , , , , Яндекс   

    Начал прохождение специализации по Машинному обучению на курсере 

    К сожалению, набор на программу Анализ данных на степике прекратился (( Задумка была хорошая, насыщенная программа обучения от Института биоинформатики. В конце выдавался диплом о переподготовке, а прохождение программы было условием для поступление на магистратуру по биоинформатике. Есть вероятность, что закрыли временно.

    Сами курсы, из которых состоит программа, кстати, остались доступными, включая проверочные задания + бесплатно + по многим в конце выдается сертификат.
    От программы осталась очень полезная карта траектории прохождения курсов:

    Я проходил отдельные курсы. За лето прошел два, на программу записаться так и не успел. Но нет худа без добра. Желание продолжать постигать Data Science никуда не делось и потому решил пройти одну из самых популярных программ по сабжу — специализацию «Машинное обучение и анализ данных» на курсере от Яндекса и МФТИ. С 4 сентября приступил к первому курсу (всего 6 курсов и финальный проект). (More …)

     
  • Ruslan.Kayumov 21:52 on 06.09.2017 Permalink | Reply
    Метки: люди, , теория игр   

    Перед нами математическое обоснование, почему доверие в долгосрочной перспективе является оптимальной стратегией. То, что нормальный человек обычно чувствует интуитивно, здесь формулируется в объективном виде. Тот замечательный случай, когда математика укрепляет вашу веру. Веру в людей ) Всего 30 минут интерактива.

    https://notdotteam.github.io/trust/

     
  • Ruslan.Kayumov 21:57 on 13.08.2017 Permalink | Reply
    Метки: , перевод, сервисы, ссылки   

    Сервис создания машинного перевода для материалов сайта (любые CMS)
    https://ru.gtranslate.io
    Бесплатно — без создания ссылок для переведенных материалов.
    За 240 руб / мес каждый материал получит ссылку на языке перевода, плюс появится возможность редактирования материала.

    ____

    Вариант для ручного перевода в WP

    Polylang

     
  • Ruslan.Kayumov 02:17 on 13.08.2017 Permalink | Reply
    Метки: , smm, Twitter, продвижение   

    Реальный быстрокейс по получению трафика и клиентов с твиттера 

    В конце июля Бишоп (модератор на OpenTraders) переписывался в скайпе со знакомым о судьбах биржи BTC-E. Знакомый ничего не знает о самой бирже, зато увлекается картами Таро и решил бросить расклад на то, откроется ли биржа до 10 августа, как того обещали администраторы биржи, или нет. Расклад, мягко говоря, обнадеживал мало: «ни одной позитивной карты…».

    Бишоп предложил выложить его в виде статьи (все ссылки будут в конце). В итоге она оказалось одним из самых посещаемых материалов недели. Одновременно мы сделали анонс в твиттере с хештегом биржи #BTCE.

    За сутки было получено 4000 просмотров твита и 180 переходов на сайт:

    Кроме того, ссылка на статью ушла дальше в сеть. Пример: (More …)

     
c
compose new post
j
next post/next comment
k
previous post/previous comment
r
reply
e
edit
o
show/hide comments
t
go to top
l
go to login
h
show/hide help
shift + esc
cancel