@hellhoundSE

Как вам такая идея диплома?

Вот закончил 2 курс и понемногу думаю над дипломом. Пришла интересная идея сделать приложение ( веб или десктоп неважно) которое берет ваш код ( возможно даже с гита) и сканирует сайты типа стака, хабра, тостера и т.д. на наличие копипаста и плагиата. Видел много подобных программ для текста, но для кода не нашел ( не особо и искал конечно). Как по мне это будет полезно как для студентов так и для преподователей. Научного руководителя еще не искал, посчтитал что рановато . Буду рад любым отзывам. Спасибо за внимание!
  • Вопрос задан
  • 544 просмотра
Решения вопроса 2
DevMan
@DevMan
а смысл в чём? это не худ.литература: хорошие, отработанные решения принято копировать; реюзабельность кода - преимущество, а не недостаток.

или вы предлагаете каждому студенту переизобретать сортировки, методы обхода списков, стэк и вот эти ваши все сранные алгоритмывсе такое?

любой код, используищий libcurl - плагиат.
любой код, использующий популярный для платформы Х пакет для работы с У - плагиат.
просто потому, что с ними невозможно работать иначе.
и, если ваш руководитель не будет так далек от программирования как только возможно (я таких встречал), он скажет: "окстись, чувак". и, надеюсь, не будет при этом сдержан в выражениях.
Ответ написан
Комментировать
@bugagashnik
Идея для диплома: попробуй написать обработчик сообщений в формате чата. Что-то наподобие бота. Человек спрашивает: "Сколько стоит услуга?" или "Почем услуга?" или "Во сколько обойдется мне ваша услуга". А на все три вопроса бот будет выдавать ответ один и тот же, т.к. вопросы похожи. Здесь можно использовать аля машинное обучение(можно создать мелкую нейросеть), библиотеки на python есть. Нужно лишь создать большую базу данных, парсить текст на биграммы, триграммы и т.п. Интересная тема короче, щас темболее все движется в сторону нейросетей, машинного обучения.
Ответ написан
Пригласить эксперта
Ответы на вопрос 5
NeiroNx
@NeiroNx
Программист
Полная хрень, если оно будет дословно сравнивать - то не будет работать. А если будет сравнивать отдельные участки дерева - то будет на все реагировать. Потому что менять оптимальный алгоритм не принято.
Ответ написан
AleksandrB
@AleksandrB
Совсем недавно вывел "Hello world"
Зачем? Какой плагиат может быть в коде? Работа программиста (хорошего) на 90% в копировании и вставке. Все давно за тебя написано. Остальные 10% ты просто адаптируешь.
Только в твоем универе и кто-то ругается на плагиат кода, в жизни - всем плевать. Работает, да и хорошо.

Мало того, незаконно скопированный код не будут выкладывать в открытый доступ!. Ты просто не сможешь его найти.
Ответ написан
Комментировать
ApeCoder
@ApeCoder
Подобное может быть востребовано например для ролика дублирования кода (только надо искать в своей кодовой базе, а не в чужой) - такое есть например в resharper https://www.jetbrains.com/help/resharper/dupFinder.html

Ещё может быть полезно для поиска заимствования в коде который принадлежит другим. Например, если кто-то скопипастил кусок кода из проекта лицензированного под GPL то вся программа в которую скопипастили этот кусок тоже должна лицензироваться под GPL. Я думаю, что поиск таких кусков тоже может быть востребован корпорациями чтобы уменьшить риск случайного нарушения GPL и других лицензий. И дальнейших исков.

Вот ещё нашел нечто
theory.stanford.edu/~aiken/moss

Так что, если сделаете алгоритм применение ему можно найти.
Ответ написан
Комментировать
@vaservaser
Автор, ты хочешь стимулировать программистов писать велосипеды? Чтобы у каждого был свой уникальный говнокод?
Да ты просто враг человечества :)
Ответ написан
Комментировать
@evgeniy_lm
Я могу предложить более крутую идею. Можно выискивать "плагиат" теоремы Пифагора или законов Ньютона и т.п.

А если серьезно, то вам сначала стоит изучить такие понятия как "плагиат", "лицензирование", OpenSource, GPL и пр. Потом перестать выпендриваться и как все нормальные студенты-двоечники запилить очередной сайт по продаже никому ненужной фигни.
Ответ написан
Комментировать
Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации
Похожие вопросы