No.32
>>30По-прежнему интересуют модельки (и на чем или где их запускать) на велике могучем, которые могут держать большой контекст, не забывая через три поста с чего все начиналось.
No.37
>>32Из того, что я использовал, лучше всего контекст держит Mistral 0.2 instruct. Она довольно хорошо следует инструкциям и часто способна вспомнить, что там было десять абзацев назад. Но русский она хоть и понимает, но общается на нём не очень, гораздо лучшие результаты можно получить, делая переводы через deepl на английский и обратно.
Запускать можешь локально, через koboldcpp, например.
No.40
>>30Что можно обсуждать с нейросетью? ИИ сама генерирует какие-нибудь ситуации? Ну и с каким ИИ пообщаться можно?
No.41
Вышла Claude 3 — модель, которая опережает GPT-4 на всех бенчмарках.
https://www.anthropic.com/news/claude-3-family No.42
Господа, а есть что-нибудь локальное (бесплатно без смс), что может писать код по алгоритму? Конкретно интересует код под Ардуинку, и проблема в основном в библиотеках, которых дохера, и они неочевидны. Нужно что-то, чему можно человеческим языком сказать "выведи на экране вот это", а не дрочить вприсядку неочевидные функции, которые ещё и крашут все, если их неправильно объявить.
No.43
>>42Навскидку в этой ситуации лучше разориться на GPT-4, потому что на локальной сетке у тебя будет всего 7 или 13 миллиардов параметров и очень маловероятно, что среди них окажется информация именно об Arduino. Но если ты прям уверен, что прокатит - попробуй Mistral.
No.44
>>43Ну да. Почитал про эти чат-боты, и походу без видюхи с 24 ГБ ловить нечего. В принципе можно попытаться на процессоре… Найти бы специализированный ассет под Ардуину или хотя бы Си, но не думаю, что их кто-то обучает - там дохрена ручной работы для подготовки данных надо.