-
Posts
1142 -
Joined
-
Залогинился
Reputation
1137 ExcellentИнформация
-
Город
ВИЛЬНЮС
Recent Profile Visitors
6093 profile views
Display Name History
-
Вы превратно понимание роль ЛЛМ в процессе исследования :-). Если хотите LLM - это большая советская энциклопедия на очень сильных стероидах. LLM сама по себе не умеет считать, да и не в этом её задача. LLM умеет генерировать текст и код. Продвинутые LLM, вроде той же gpt-oss 120b, не простого умеют генерировать текст и код, но и имеют специальные встроенные инструменты для взаимодействия с "внешним миром" (вызова внешних API), умеют исполнять код песочнице (работать с внешними интерпретаторами) и ожидать вывода логов исполнения, а так же умеют работать с движками символьной алгебры (вроде Wolfram и ему подобными аналогами). LLM - это мощнейший инструмент, а не самоцель. И как и любой инструмент, он требует умения обращения с ним, особенно когда речь идёт о задачах естественных наук. О чём, собственно, мы тут и завели беседу. Кстати, кто не в курсе, Нобелевка по химии за 2024, полученная Demis Hassabis и John Jumper из Google DeepMind, была вручена за прорывные работы на стыке химии/биологии, которые стали возможны благодаря применению LLM. Поэтому хватит заниматься луддизмом.
-
Какие локальные модельки пробовал, какой мак (память), сколько токен/с вывод ?
-
Это общая проблема Гугла - они берутся за всё сразу, но нифига до ума не доводят. Геминай не исключение (в Gemini Enterprise тоже можно MCP подключать, но не без танцев с бубном, конечно, и различных агентов подключать). Работать можно, с учётом гуманного ценника и большого контекстного окна (предварительно настроив, конечно). Claude, конечно, шикарен, но антигуманный ценник отталкивает. А на бесплатном и на ПРО работать нормально невозможно. Делал тест на решение задач по теоретической физике и на написание научного вычислительного кода различных локальных LLM. Удивил gpt-oss 120B, прям хорошо себя показал. Если задача состоит исключительно исследовательская и не требуется 100500 токенов в секунду вывода, то имеет смысл локально развернуть gpt-oss 120b, на моём лаптопе (rtx 4060 8GB + 7945HX + 96GB DDR5 RAM) выдаёт вполне себе сносные 10 токен/с.
-
Это всё та же проблема галлюцинации ИИ, которая заложена "генетически" на уровне модели, что особенно актуально в задачах физики (читай - ко всему, что ни есть математика (closed world problems) и программирование). Задачи физики относятся к классу так называемых Open World задач, поэтому на ЛЛМку надо в явном виде накладывать многие ограничения и запреты, в том числе и при работе с источниками. Я делал бот физика-теоретика по теории дифракции, то пока научил болвана не фонтанировать "гениальными" открытиями уровня Нобелевки и работать с экспериментальными данными, пришлось составить системный промт из весьма больших 14 пунктов, где наложил и целый ряд запретов и команд.
-
Есть один момент со слышимостью ГВЗ, который даже в научной литературе нешироко обсуждают - это связь слышимости фазовых искажений с критическими полосами слуха (там нотбуке есть совершенно фундаментальная книжечка Цвикера и Фельдкеллера, в которой рассматривается и этот вопрос).
-
Смотри здесь.
-
Обрати внимание, что в работе Preis'а нету таких значений порогов слышимости ГВЗ, какие указаны в табличке. Это либо галлюцинации ЛЛМ, либо данные из других работ.
-
Не знаю, в каких исследованиях это указано, но для своего же спокойствия всё цифры, приводимые LLM, лучше проверять вручную или вычленять каждую приводимую им цифру и вести по ней отдельный диалог. Поскольку я достаточно досконально исследовал всю имеющуюся литературу по этому вопросу, могу кратко прокомментировать. Ниже - некоторые данные из исследования Dr. Douglas Prise, Phase distortion and phase equalization in audio signal processing. Он приводит значения в 2.5 мс. Но надо иметь ввиду, что пороги слышимости ГВЗ коренным образом зависит от типа сигнала (на речевых, сложных музыкальных, шумовых сигналам порог выше из-за эффектов маскировки, на коротких импульсных-широкополосных (щелчки, импульсы Гаусса и т.п.) - существенно ниже) и условий прослушивания. Это первое. И второе, большинство работ по порогам слышимости ГВЗ делаются в наушниках, поэтому определяющее влияние комнаты не учитывается. Когда речь идёт о НЧ, имеет смысл обсуждать пороги слышимости временного затухания резонансов в помещениях, а не само ГВЗ акустической системы как таковой.
-
Коллега звукорежиссёр несколько лет назад попросил помочь оформить офисное помещение (для озвучки/дубляжа фильмов). Время реверберации получилось что-то в районе ~150мс. Лично мне очень понравилось. Сцена даже на его очень недорогих мониторчиках Ямаха была весьма детальной. Хотя, вроде как, принято считать, что оптимум для прослушивания - ~0.3с, а 150мс - это уже переглушено. Так же понравилось ощущение тишины - фоновый уровень шума весьма ощутимо сильно упал.
-
Ставь в стену рупор на axi2050 + чего-нибудь мелкое рупорное сверху, снизу - массив пурифаёв. Рупора можно сделать асимметричными, чтоб лучом бил прямо в точку прослушивания. Передок комнаты можно сделать диффузным-живым, зад - мертвым (LEDE). Будет эталонная система :-).
-
Я не нашел никаких данных, что AX2 был запатентован, соответственно и основания для судебных тяжб не могло быть. Можно, конечно, предположить, что в Ямахе в 90-ых работали полные идиоты и не смогли прочесть диссертацию и адаптировать её результаты для своих нужд, но это предположение совершенно не соответствует действительности. Всё это похоже на какую-то городскую легенду.
-
Рупор (AX2) проектировал не столько Филип Ньюэл, сколько Кейт Холланд, который по данному рупору защитил кандидатскую диссертацию (PhD) в 1994 году. Ньюэл Предоставлял финансовую поддержку Холланду и учавствовал в обсуждении результатов, и по результатам исследований Холланда спроектировал свои двухполосные активные мониторы. Так то диссертация является публично доступной и все изложенные там материалы могут быть свободно использованы, в том числе и рупор. Сам по себе рупор Ньюэла является почти классической экспонентой, с несколько измененным устьем.
-
Это ж штучный товар. Примерно содрать, конечно, можно, и не такое копируют, но продавать такое будет сложно, особенно с учётом гарантированных претензий с нашей стороны. Такое втихаря продать не получится. Воруют, обычно, то, что легко делается, и массово продаётся.
-
Если вкратце - все рупора на фото имеют оригинальный раскрыв, оптимизированный методом граничных элементов. Акустическая оптимизация сама по себе является нетривиальной задачей, связанная с задачей полиномиальной аппроксимации оптимизируемой поверхности, выбором алгоритмов оптимизации, задачей целевых функций оптимизации, работой с сетками, численными методами, глубоким погружением в физику рупоров. Сложность данного проекта была связана ещё и с тем, что поверх оптимизационной задачи акустики были строго наложены сразу тва граничных производственно-дизайнерских условия: 1. качество переходов поверхности должно быть не хуже G2-G3 2. И самое жесткое (что особенно выело мозгу) - конструкция должна быть CNC-френди в производстве. Совместить оптимизацию акустических параметров, G2-G3 качество поверхностей, и дружелюбность конструкции к ЧПУ производству было весьма и весьма непростой задачей (особенно с учётом того, что в ходе работы выяснилось, что заставить многие именитые CAD пакеты рисовать поверхность качества G2-G3 без косяков - задача ещё та). Это что касается части физики и математики. Отдельного обсуждения заслуживает производство этой красоты. Это был отдельный вызов. Тут теория сталкивается с суровой действительностью производственной культуры. То, что Олег смог организовать производство этого проекта - это отдельный подвиг. И, в общем-то, свидетельство того, что в РФ имеются очень рукастые товарищи/коллективы с правильным устройством головного мозга, которые могут делать удивительные вещи при правильной организации труда :-). Тут выше высказывался тезис, что уровень этого проекта находится на уровне того, что за бугром. На самом деле это один из самых комплексных проектов "Hi-End" индустрии как за болотом, так по эту сторону болота. За болотом ещё придётся поискать рупорные (да и не только) проекты подобной дотошности. Это вовсе не значит, что нельзя сделать ещё лучше - однозначно можно ! Но далее повышать рамку качества и задать ультимативную и практически недосягаемую планку объективных параметров для большинства игроков индустрии можно только подтянув производство кастомных драйверов (хотя планка объективных параметров уже и сейчас практически недосягаема для большинства игроков индустрии). Ну и напоследок в качестве иллюстрации - сравнение переходных процессов в рупорах. Парочка популярных vs. одна из итераций губастеньких СЧ. Момент рабочего процесса оптимизации НЧ звена.
-
Mac M3 ultra с 512Гб юнифаэд памятью для запуска самых сочных локальных моделек для кодинга не рассматривал ?
