Со мной можно связаться через эл. адрес goo.gl/Jil82I пройдя тест reCAPTCHA

Наибольший вклад в теги

Все теги (134)

Лучшие ответы пользователя

Все ответы (703)
  • Как классифицировать текст с помощью нейронной сети?

    @2ord
    продвинутый чайник
    Если знаний в компьютерной лингвистке чуть больше чем ноль, то задачу решить получится не скоро ...
    Почему-то поголовное большинство разработчиков тешутся надеждой, что нейронные сети магическим образом решат любую задачу в области искусственного интеллекта.

    А какими примерами обучать нейросеть? Ведь не голым текстом... Типа, говоришь нейросети: "глянь, тут человека упомянули". Так что-ли? Для компьютера текст - это лишь последовательность байтов, поэтому он не может понять что для нас-людей представляет интерес. Компьютеру нужно всё разжевать и объяснить на языке цифер.
    Ведь как носители языка понимают, что в тексте речь о людях? Есть набор запомненных слов (словарь), которые человек прочтя или услышав, сравнивает со своим словарным запасом и тогда решает, к какой категории относится слово в данном контексте.

    Чтобы, проанализировав текст, понять, что "ищут ли какого то человека, мастера", необходимо вычленить некоторые ключевые слова, взятые из словаря: "ищу", "помогите", "подскажите", "посоветуйте", "требуется" и т.д., в сочетании с упоминанием людей (синонимы) и профессий (словарь профессий).
    Нейронная сеть на этом этапе не нужна. Она поможет в классификации при работе с цифрами, фактами (булева логика). Так что перед анализом текста нужно извлечь факты и связи из текста и затем скармливать ими классификатор. Помимо нейронных сетей есть другие виды классификаторов, более простых и лёгких в использовании, такие как байесовский классификатор. Нейросети могут быть как с обучением, так и без.

    В качестве вводной части имеет смысл начать с лекции Яндекс - Малый ШАД - Лингвистика в поиске.pdf
    По практической части: Что такое Томита-парсер, как Яндекс с его помощью ...

    Возможно, задача решается проще и без нейросетей.
    Ответ написан
  • Какие алгоритмы нужно знать веб разработчику?

    @2ord
    продвинутый чайник
    Не помню когда какой алгоритм использовал последний раз в веб-разработке.
    Из алгоритмов порой может использоваться разве что линейный и бинарный поиск в массивах. В любом случае, как правило, такие алгоритмы реализованы в стандартных библиотеках и поэтому остаётся лишь вызвать нужную функцию.
    Порой нужно посчитать что-то несложное, например статистику с выборкой по разным таблицам в БД или что-то по простенькой формуле. Изредка-изредка попадаются немного более сложные задачи. Но задач типа динамического программирования или по искусственному интеллекту не жди - такие задачи обычно решаются программистами с другой квалификацией, независимо от веб-разработки.

    В веб-разработке важно чтобы запрос к серверу занял как можно меньше времени. Для этого нужно быстро обратиться к БД, что-то посчитать и вернуть ответ. Пользователь не любит ждать. Порой нужно использовать техники кеширования данных и некоторые другие оптимизации.
    По-моему, основными факторами задержки являются:
    1. неоптимальные запросы к БД
    2. неоптимальный выбор структур данных и, как следствие, понижение скорости работы и повышенные требования к памяти
    3. повторяющиеся операции в коде
    4. блокирующие операции в коде
    5. неоптимальная отдача статического контента сервером
    Ответ написан
  • Нужен ли антивирус для LINUX, какой выбрать?

    @2ord
    продвинутый чайник
    tl;dr
    Ошибочно думать, что Линукс полностью защищён от вредоносного ПО. Есть много примеров заражения различных сетевых инфрастурктур и эксплуатации Linux систем.

    Залог безопасности любой ОС - это своевременные обновления её компонентов и установленного на ней ПО, устраняющие в них уязвимости.

    С точки зрения подключения компьютера к сети, межсетевой экран (файрвол) призван защищать систему от несанкционированного доступа на уровне сетевых портов и протоколов. Если общение ПО на компьютере с внешним миром санкционировано межсетевым экраном на уровне протоколов, то ничего не препятствует удалённому ПО попытаться проэксплуатировать уязвимости на установленном ПО. И если какая-то дыра будет найдена, то троян установится без ведома пользователя и сможет выполнять вредоносные функции: стать "солдатом" в армии ботов, похищать данные и т.д.

    Может я и не прав, но насколько мне известно, антивирус в Линуксе не имеет полномочий вмешиваться в работу работающего ПО, он выполняет чисто функции ручного сканирования файлов на наличие заразы, скажем, при открытии писем в почтовом клиенте.
    Таким образом, основную функцию защиты системы выполняют ядро Линукса - с точки зрения доступа к участкам памяти и запуска процессов.

    Советую почитать материал о целесообразности использования антивируса в Линуксе на англ. или машинный перевод на русский.

    Что должен делать рядовой пользователь Линукс?
    1. Устанавливать дистрибутивы Линукса только с ISO образов, загруженных с официальных сайтов. Обзор известных дистрибутивов находится на сайте http://distrowatch.com
    2. Не игнорировать предложения системы обновить установленное ПО, а делать обновление как можно скорее.
    3. Устанавливать ПО только через пакетный менеджер системы (Synaptic и т.д., зависит от дистрибутива).
    4. Устанавливать ПО через исходники не рекомендуется по той причине, что эта процедура чревата проблемами как со сборкой нужных пакетов, так и в плане безопасности. Во-первых, установка в штатном пакетном менеджере делается через проверенные источники-репозитории. Во-вторых, любые исправления уязвимостей приходят только через штатную систему обновления в виде оповещения. А собранные пакеты с исходников нужно пересобирать и устанавливать с появлением каждой уязвимости. Любое замедление ставит риск эксплуатации системы.
    Ответ написан
  • В каком формате лучше всего размещать документы в сети - docx, rtf или odt?

Лучшие вопросы пользователя

Все вопросы (44)