@sidorchik

Как распарсить каталог книг?

В библиотеке есть большой книжный каталог. Вот три строки из него:
Arthur Conan Doyle – The Adventures of Sherlock Holmes, George Newnes 1892
Ernest Hemingway – The Old Man and the Sea, Charles Scribner's Sons 1952
Ralph Leighton, Richard Feynman – Surely You're Joking, Mr. Feynman!, W.W. Norton 1985

Скажите, пожалуйста, как из каждой строки вычленить три сущности: автора книги, название и издательство с годом. Мне это нужно, чтобы переместить каталог в базу данных.
  • Вопрос задан
  • 149 просмотров
Решения вопроса 1
hzzzzl
@hzzzzl
вот прям всегда такой формат? тогда можно тупо в лоб в цикле

s = 'Arthur Conan Doyle – The Adventures of Sherlock Holmes, George Newnes 1892'
author = s.split('–')[0].trim()
by = s.split('–')[1].trim()
last = by.lastIndexOf(' ')
book = by.slice(0, l).trim()
year = by.slice(l).trim()


UPD
ах, это про php вопрос, в нем я не силен :) ну как-то так же можно по любому тоже
Ответ написан
Комментировать
Пригласить эксперта
Ответы на вопрос 1
@Kutuzov_ska
Я уверен, что здесь обязательно помогут регуляркой. Будет что-то вроде preg_match('/(.*)-(.*),(.*)/', .... $kek)
$kek[0] - Автор и т.д.
А попробуйте максимально крутой метод для гордости:) Если есть и будет возможность.
Используйте библиотеку FANN
https://www.php.net/manual/ru/book.fann.php

И вот туториал https://phpnick.ru/posts/category/php/48
Сделать по аналогии небольшой датасет

И вот у вас искусственный интеллект который парсит книги:)
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
18 апр. 2024, в 21:56
2000 руб./за проект
18 апр. 2024, в 21:00
150 руб./за проект