@nazmutdinovrafael

Почему Sphinx не ищет на русском?

Sphinx ищет на латинице, а на кириллице – нет. Кодировка БД – UTF-8 Unicode (utf8), сравнение – utf8_unicode_ci.

Пример поиска на латинице:
Запрос:
SELECT * FROM `category` WHERE MATCH('mol') LIMIT 10
В логе Sphinx:
[Mon Jun 24 18:37:43.275 2019] 0.000 sec 0.000 sec [ext2/0/ext 2 (0,10)] [category] mol
Результат:
{"categories":[{"id":9,"name":"Молочные изделия","keywords":"молоко"},{"id":30,"name":"Кофе молотый","keywords":""}]}

Пример поиска на кириллице:
Запрос:
SELECT * FROM `category` WHERE MATCH('мол') LIMIT 10
В логе Sphinx:
[Mon Jun 24 18:42:03.530 2019] 0.000 sec 0.000 sec [ext2/0/ext 0 (0,10)] [category] мол
Результат:
{"categories":[]}

Конфиг Sphinx:
source category_src
{
	type			= mysql

	sql_host		= 127.0.0.1
	sql_user		= root
	sql_pass		= root
	sql_db		 = myproject
	sql_port		= 3306

    sql_query_pre = SET NAMES utf8

	sql_query		= \
		SELECT `category`.* \
		FROM `category` \
		WHERE `category`.`is_deleted` = 0

	sql_attr_string = name
	sql_attr_string = keywords
}

index category
{
	source			= category_src
	path			= /usr/local/var/data/category

    docinfo = extern
    dict = keywords
    charset_type   = utf-8
    charset_table  = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F, U+401->U+451, U+451
    blend_chars    = &, ., +, U+23
    morphology = stem_enru, soundex, metaphone
    index_exact_words = 1
	expand_keywords = 1
	min_word_len = 1
	min_prefix_len = 1
	html_strip = 1
	mlock = 0
}


indexer
{
	mem_limit = 128M
}


searchd
{
	listen = 9312
	listen = 9306:mysql41
	log	= /usr/local/var/log/searchd.log
	query_log = /usr/local/var/log/query.log
	read_timeout = 5
	max_children = 30
	pid_file = /usr/local/var/log/searchd.pid
	seamless_rotate	= 1
	preopen_indexes = 1
	unlink_old = 1
	workers	= none
	binlog_path	= /usr/local/var/data
}
  • Вопрос задан
  • 68 просмотров
Решения вопроса 1
opium
@opium
Просто люблю качественно работать
Судя по описанию должен искать, если что то меняли то попробуйте сделать переиндксацию и перезагрузить сам сфинкс
Ответ написан
Пригласить эксперта
Ответы на вопрос 1
@sait4seo
Проверьте/установите кодировку соединения
через терминал так mysql -u root -P 9306 --default-character-set=utf8
Ответ написан
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы
от 180 000 до 200 000 руб.
МАКСИДОМ Санкт-Петербург
от 85 000 до 110 000 руб.
Кабель.РФ Саранск
от 70 000 руб.
22 авг. 2019, в 18:19
5000 руб./за проект
22 авг. 2019, в 18:16
5000 руб./за проект