Как выровнять процентное распределение по данным?

Question

Антон Тарара @atarara

Как выровнять процентное распределение по данным?

Здравствуйте коллеги. У меня такой вопрос. Имеется датасет. В нем есть признаки(столбцы) бинарные. но в этих столбцах соотношение True к False не очень ровное. Например True 90% а False 10%. Как выровнять сразу по всем признакам эти данные? Добавив рандомно новые? В Studio ML есть такой инструмент называется SMOTE, но он работает только с одним признаком. Может быть есть какие то механизмы для pandas или numpy? Спасибо

Вопрос задан более трёх лет назад
173 просмотра

1 комментарий

Подписаться 3 Средний 1 комментарий

Пригласить эксперта

Ответы на вопрос 2

2 комментария

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

IT-образование

+3 ещё

Простой
Какая есть литература полезная и понятная по Data Science на русском?
- 3 подписчика
- 17 апр.
- 960 просмотров
1

ответ
Машинное обучение

+2 ещё

Простой
Создание нейронной сети для определения сортов яблок. Как осуществить?
- 1 подписчик
- 11 апр.
- 84 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Как работает адаптивный бустинг для регрессии?
- 1 подписчик
- 05 апр.
- 24 просмотра
0

ответов
Машинное обучение

+1 ещё

Средний
Чем отличается стекинг от блендинга?
- 1 подписчик
- 02 апр.
- 48 просмотров
1

ответ
Python

+1 ещё

Средний
Как можно добавить и протрансформировать изображение на другое изображение?
- 1 подписчик
- 30 мар.
- 71 просмотр
1

ответ
NumPy

Простой
Как собрать видео из list[np.array]?
- 1 подписчик
- 26 мар.
- 28 просмотров
0

ответов
Машинное обучение

+2 ещё

Простой
Что технически(какие it решения, технологический стек) нужны для создания ии ,который сможет на основе жалоб ставить диагноз?
- 1 подписчик
- 21 мар.
- 112 просмотров
3

ответа
Машинное обучение

Средний
Какой метод машинного обучения применить и как?
- 1 подписчик
- 19 мар.
- 58 просмотров
1

ответ
Машинное обучение

Средний
Как исправить переобучение сверточной нейронной сети(keras)?
- 1 подписчик
- 18 мар.
- 47 просмотров
0

ответов
Машинное обучение

+2 ещё

Простой
Как выбрать своё направление из двух совершенно разных?
- 1 подписчик
- 16 мар.
- 97 просмотров
2

ответа
Показать ещё Загружается…

Data Scientist (Финтех)

Intelinvest

от 60 000 ₽

Senior ML Engineer (Computer Vision)

Gradient

от 450 000 ₽

Python/Django-разработчик (mobile+AI)

4Taps AI • Тольятти

от 150 000 до 250 000 ₽

Нарисовать баннер для интернет-магазина

19 апр. 2024, в 20:35

500 руб./в час

Разработать несистемный алерт

19 апр. 2024, в 20:11

500 руб./за проект

Расработка Парсер для сайта https://soliq.uz/activities/debtor

19 апр. 2024, в 19:51

3000 руб./за проект

Нифига не понял, но подписался. Интересно узнать что скажут люди.

Answer 1 · 2018-03-30 13:59:12

Идея разбодяжить настоящие данные фейковыми, чтобы получить что-то толковое - это бредовая идея.
Инструменты для реализации бредовых идей можно подобрать, да.

Answer 2 · 2018-03-30 22:05:06

contrib.scikit-learn.org/imbalanced-learn/stable

Но вообще 90 на 10 - вполне здоровое соотношение для большинства случаев.

Как выровнять процентное распределение по данным?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт