Gpu driver error no temps hive os как исправить

Обновлено: 30.06.2024

> Claymore Reboot: Temperature control thread hangs, need to restart miner!

далее низкий хэшрейт и ферма виснет.бывает перезагрузится поработает а потом заново такая фигня.
кто сталкивался? помогите решить проблему?

Вложения
Местный житель
Kapitalizm
Друг форума
кому не нравится вин - вот вам реф на хайвос или рейвос , помогу настроиться)
arhangel
Местный житель

При работе фермы выскакивает:

>Autofan: GPU driver error, no temps

> Claymore Reboot: Temperature control thread hangs, need to restart miner!

далее низкий хэшрейт и ферма виснет.бывает перезагрузится поработает а потом заново такая фигня.
кто сталкивался? помогите решить проблему?

Александр Агейкин


Александр Агейкин

Антон Буланцев

Александр, райзер можно как то найти неисправный ? просто вроде прошелся и все сидит

Александр Агейкин


Александр Агейкин ответил Антону

Антон, по очереди одну карту убирать и тестить
Никак более
А у ошибки разве не пишется какая карта?

Антон Буланцев

Александр, у меня хайв виснет (ничего не могу посмотреть) увидел только через браузер эту ошибку

Hive OS

Антон Проняшкин

Антон Проняшкин запись закреплена

Алексей Перевощиков

Антон Проняшкин

он загрузился и это видимо должна была быть установка. но нет не установился поскольку на этом экране он провисел 2 часа без изменений. Пришлось перезагрузить (в кабинете хайва риг видно и он отвечает) и откатить майнер. Драйвер остался прежний, хайв обновился до последней, а майнер пришлось откатить на версию назад.

Антон Проняшкин

Повторные попытки обновить драйвер приводят к этому же экрану и ничего не движется далее. Хотя в прошлом драйвер обновлялся. правда с ошибкой. Ладно видимо буду ждать пока драйвера все же будут не в бета режиме.

Алексей Перевощиков

При ошибке установки драйвера:
disk-expand для расширения раздела(чаще всего этого достаточно для решения проблемы)

Алексей Перевощиков

Если проблему это не решило тогда:
mc и удалить неиспользуемые драйвера из папки /hive-driver-pack
hpkg remove miners noinstall - удалить все майнеры
logs-on
reboot

Алексей Перевощиков

После перезагрузки:
miner stop - остановить майнер
wd stop - остановить хешрейтватчдог
apt update
nvidia-driver-update

Алексей Перевощиков

Все эти процедуры выполнять желательно через селинабокс находясь в локальной сети с ригом или через hiveshell если риг далеко.

Алексей Перевощиков

Ни в коем случае не вводить эти команды с клавиатуры подключенной прямо к ригу. И крайне нежелательно вводить эти команды через консоль. Консоль я бы рекомендовал только для ввода очень простых команд типа остановить/запустить майнер, посмотреть лог майнера и подобных.

Sergey Sergey

Autofan: GPU temperature 511 is unreal, driver error


Ошибка GPU temperature 511 is unreal, driver error, как правило возникает из-за проблем с питанием райзеров или видеокарт. Может возникать эпизодически или с нарастающей частотой, обычно на риге "отваливаются" видеокарты, как правило подключенные к одному и тому же блоку питания и ферма перезагружается. Непосредственная причина может быть в обгорающих контактах в разъемах цепей питания, некачественных переходниках питания райзеров и видеокарт, некачественных кабелях и неисправностях в схемотехнике блоков питания.

Совет: USB райзеры 006c с разъемами питания 6 pin и серверные блоки питания, оптимальны для построения ферм с количеством видеокарт от 6-и и выше.

Часто незафиксированный разъем переходника (см. фото) приводит к подгоранию контактов и проводов внутри разъема и появлению ошибки Autofan: GPU temperature 511 is unreal, driver error.


Совет: чем меньше переходников используется в ферме - тем лучше.

Проверяем в таком порядке: ревизируем и заменяем переходники питания и коннекторы; меняем райзера; меняем блоки питания. Промеряйте напряжения на всех разъемах, случается вместо 5 вольт или 12 блок питания подает повышенное или пониженное напряжение.

В ряде случаев ошибку можно наблюдать из-за некачественной внешней линии питания или пониженного или повышенного напряжения в ней. Здесь алгоритм действий следующий, проверяем: напряжение в линии питания вольтметром, кабели блоков питания, удлинители, сетевые фильтры и качество проводки. Промеряйте ваттметром энергопотребление фермы, повышенное потребление сигнал о некачественной проводке (может быть скрытый нагрев в стенах и распределительных коробках), неплотных и подгорающих контактах питания в цепи или выходе из строя одного из потребителей.

Иногда оправдано протянуть отдельную линию питания для фермы от щитка со своим автоматом или группой автоматов для каждого рига. Провода и разъемы, после монтажа, не должны нагреваться, используйте клемники и хорошие провода с толстым сечением и обязательно заземляйте блоки питания ферм и другое оборудование.

Совет: отдельная линия питания со своим автоматом на каждый риг и общим автоматом на группу ферм, наилучшее и профессиональное решение.

В случае если ферма работает на нескольких блоках питания, проблема GPU temperature 511 is unreal, driver error, приводит к полной остановке одного из блоков питания. Это сужает круг поиска проблемы, ревизируйте линии питания ведущие к этому блоку, вскройте (если блок не гарантийный) и проверьте сам блок (вздувшиеся и разорванные конденсаторы, поврежденные микросхемы, потемнения текстолита в районе дорожек и прогары) как вариант можно заменить блок питания. Иногда может помочь простая пересборка фермы, когда вы переподключите все коннекторы питания, устранив неплотный контакт в переходниках.

Откажитесь от использования дешевых китайских переходников 8 pin CPU на 2x6+2 pin VGA. Сечения провода используемого в таких переходниках явно недостаточно для продолжительной работы фермы под нагрузкой.


На фото видна разница в толщине медного провода используемого в проводах - левый провод на фото от блока питания Chieftec, правый провод на фото - это провод от дешевого китайского переходника 8 pin CPU на 2x6+2 pin VGA, цена которому 150-200 рублей. На левом фото провода сразу после снятия изоляции, на правом фото медные жилы скручены. Субъективно разница в сечении провода в три раза, при этом если учесть толщину провода с учетом изоляции, то по толщине провода примерно равны.

Если все вышеперечисленные мероприятия не помогли, поменяйте все блоки писания на которых работает ферма и помониторьте работу оборудования с новыми блоками питания. Не рекомендуем использовать блоки питания из недорогих линеек производителей Zalman, Aerocool, ACCORD и т.д. В случае с подобными блоками питания даже сертификат стандарта 80 PLUS BRONZE, не дает ни каких гарантий стабильной работы фермы.

В практике был случай когда блок питания AeroCool HIGGS Modular мощностью 850 Ватт, просаживался по линии питания +3.3 вольта, и эта линия питания даже не была задействована в работе фермы, райзера использовались с разъемами Molex, но ферма останавливалась. И сколько мы не измеряли напряжения под нагрузкой во время работы фермы, причину сбоев в работе понять не могли, ведь измеряли напряжения по линиями +12 вольт и +5 вольт. Заменили блок питания, ферма заработала стабильно и уже только после этого, в результате полной диагностики блока питания, неполадку удалось выявить и устранить.

Happy Mining - счастья всем и каждому, поменьше ошибок в подборе комплектующих, сборке ферм и майнинге!

Читайте также: