Как найти разницу между двумя csv файлами по индексу используя Pandas?

Question

malvin @malvin

Python
CSV

Как найти разницу между двумя csv файлами по индексу используя Pandas?

Нужно (1)вычесть из цсв с айди и ссылками другой цсы с айди, (2)удалить ячейки без ссылок и (3)дубликаты.

Пробую вот этот метод, но он складывает данные вместо вычетания. Я так понимаю, потому что во втором файле нет поля сайты. Как быть?

df1 = pd.concat([df,cite_id]).drop_duplicates(keep=False)[['id','website']]

df - фрейм с двумя колонками.
cite_id - фрейм с одной колонкой id.

Вопрос задан более трёх лет назад
173 просмотра

Комментировать

Подписаться 3 Простой Комментировать

Решения вопроса 1

Комментировать

Пригласить эксперта

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

Python

Средний
Как выполнить авторизацию MS CHAP 2?
- 1 подписчик
- 51 минуту назад
- 12 просмотров
0

ответов
Python

+1 ещё

Простой
Как вычислить количество записей?
- 1 подписчик
- 4 часа назад
- 59 просмотров
2

ответа
Python

+1 ещё

Простой
Почему при использование webdriverIE все равно открывается EDge?
- 1 подписчик
- 6 часов назад
- 14 просмотров
0

ответов
Python

Простой
Почему мой discord бот не реагирует на свои команды?
- 1 подписчик
- 7 часов назад
- 48 просмотров
0

ответов
Python

Простой
Как получить экземпляр родителя из дочернего класса?
- 1 подписчик
- 18 часов назад
- 115 просмотров
1

ответ
Python

Простой
Как указать когда нужна рекурсия а когда нет?
- 1 подписчик
- 20 часов назад
- 73 просмотра
1

ответ
Python

+1 ещё

Простой
Как сохранять сессию во Flask?
- 1 подписчик
- вчера
- 46 просмотров
0

ответов
Python

+1 ещё

Простой
Как реализовать Python-код, который будет распознавать речь, но будет реагировать только тогда, когда будет упомянуто определенное слово?
- 1 подписчик
- вчера
- 100 просмотров
2

ответа
Python

Простой
Как создать offline карту на python?
- 1 подписчик
- вчера
- 140 просмотров
2

ответа
Python

Простой
Какие модули есть в Python для целей анализа, форматирования, вывода текста?
- 2 подписчика
- вчера
- 234 просмотра
3

ответа
Показать ещё Загружается…

Team Lead (С++, Python)

TopAssistant • Москва

от 400 000 ₽

Python developer

Bell Integrator

До 350 000 ₽

Python developer

Greenway Global • Новосибирск

от 150 000 ₽

Сделать дизайн главной страницы сайта

19 апр. 2024, в 19:17

1500 руб./за проект

DevOps задачи, работа с Yandex Cloud и Yandex Database

19 апр. 2024, в 18:38

1500 руб./в час

Верстка сайта -4-5 страниц

19 апр. 2024, в 18:36

1500 руб./за проект

Answer 1 · 2018-09-22 09:57:30

На StackOver подсказали ответ.

df.dropna().drop_duplicates()
cite_id.dropna().drop_duplicates()
df[~df.id.isin(cite_id.id.values)]

P.S. вот еще нашел крутую обучалку на трубе (Английский) - Pandas Tutorial

Как найти разницу между двумя csv файлами по индексу используя Pandas?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт