Machez
@Machez
Бу!

Как определять схожесть названия товара от разных поставщиков?

Проблематика такова. Товарный ассортимент интернет магазина формируется на основании нескольких excel-файлов от разных поставщиков. Допустим в файле поставщика "А" есть товар "Пылесос Тайфун черный", а в файле поставщика"Б" есть такой же товар, но с немного измененным названием "Пылесос Тайфун (цвет: черый)". Как выявлять схожесть товаров, чтобы свести к минимуму наличие в базе данных одинаковых (дублирующих) товарных позиций?
  • Вопрос задан
  • 346 просмотров
Решения вопроса 2
ну например индексирование каталога sphinx-ом и вывод возможных дублей на моменте импорта, либо похожие средства поиска
Ответ написан
Комментировать
@d-stream
Готовые решения - не подаю, но...
В общем случае для достаточно однозначной идентификации были придуманы номенклатурные номера. А так же альтернативные коды для альтернативно одаренных поставщиков со своими кодами и т.п.
А в частном - есть куча рисков смешать в разделе кухонный со строительным миксеры или опять же строительный и не очень вибраторы...
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 2
POS_troi
@POS_troi
СадоМазо Админ, флудер, троль.
Давно было, где-то в начале 2000-х.

Выгрузка в каталог осуществлялась из 1С 7.7., предварительно в эту самую 1С загружались все прайсы поставщиков, для каждого поставщика был справочник синонимов.
"Пылесос Тайфун (цвет: черый)" => "Пылесос Тайфун черный".
При импорте прайса, просто проверялись наименования по справочнику синонимов и приводились к общему виду.

Очень тупое решение в лоб, но к счастью это были "авто шины" и более или менее у всех было одинаково.
Ответ написан
Комментировать
zolt85
@zolt85
Программист
В своем проекте используем сравнение двух строк при помощи "Расстояния Левенштейна" для предотвращения внесения дублей в справочник организаций, ибо кто-то пишет Роснефть, кто-то РОСНЕФТЬ, кто-то ставит кавычки в названии, а кто-то не ставит, и все в таком духе. Вполне рабочий вариант.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы