OSDev

для всех
Текущее время: 30 апр 2024, 05:16

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 31 ]  На страницу Пред.  1, 2, 3, 4  След.
Автор Сообщение
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 18 июл 2011, 19:13 
Аватара пользователя

Зарегистрирован: 16 май 2007, 23:46
Сообщения: 1126
Цитата:
Если NVidea GPU - это массивно-параллельный процессор заточенный под определенный спектр задач, то Larabee - это массивно-параллальная сеть
Думаю что с NVidea вы неправы. Они себя позиционируют как сеть универсальных процессоров. В отличии от AMD\ATI которая говорит о потоковой обработке.
Думаю что SII правя в утверждение, что в сложной архитектуре трудно поднять частоту. Сам я в этом не силён, но знаний хватает чтобы сделать вывод. Поэтому AMD\ATI и быстрее NVidea правда разница в полпоколения не показатель.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 16:10 

Зарегистрирован: 18 апр 2010, 15:59
Сообщения: 155
ну может быть я чего-то не знаю.

Могут ли потоковые процессоры в GPU исполнять различные нити кода, обмениваться данными, хэндлить ввод-вывод? Вы сможете написать ОС, ядро которой будет выполняться исключительно на GPU? А Intel в Larabee планировал запилить ядра Pentium со всеми вытекающими. По сути Larabee - это 80-ядерный x86 процессор, со всеми вытекающими. У этого проекта я наблюдаю только одну, но зато фундаментальную проблему: чудовищный bottleneck на шине процессор-память.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 16:16 

Зарегистрирован: 18 апр 2010, 15:59
Сообщения: 155
И кстати, судя по всему, они активно пытаются побороть эту проблему. Об этом говорят недавний выпуск экспериментального 48-ядерного процессора и текущий проект "Terra".


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 17:37 

Зарегистрирован: 28 окт 2007, 18:33
Сообщения: 1418
Ну, если отвечать без политкорректности, то сейчас Вы выдали полный бред. Препятствием для реализации полноценной ОС на графических процессорах что АМД, что Невидии являются не какие-либо архитектурные ограничения этих процессоров, а то, что они на сегодняшний день подключены к системной шине не как центральные процессоры, а как внешние устройства. Вследствие этого они в принципе не способны сконфигурировать мосты, обеспечивающие соединение всех устройств вычислительной системы, а значит, не могут "дотянуться" до периферии, которой ОС должна управлять. Но абсолютно та же ситуация будет иметь место, если вместо видюхи от Невидии или АМД влепить эту идиотскую Ларабее: будучи отрезанной от конфигурационных ресурсов мостов, сей монстр абсолютно ничего с вводом-выводом сделать не сможет. В общем, лучше подучите устройство ПК, а не делайте глубокомысленные выводы на основе рекламных материалов столетней давности.

А "все вытекающие" из впендюривания ядер Пентиума заключаются в: А) катастрофически огромных размерах каждого процессорного ядра по сравнению с ядрами графических процессоров, из-за чего их уместится на одном кристалле на два порядка меньше; Б) проистекающей из пункта А катастрофически низкой производительности на параллельных вычислениях (как минимум на те же два порядка ниже, чем у обычных ГП -- и это без учёта того, что более сложное ядро труднее разогнать по частоте, а потребляет оно больше энергии, которую ещё нужно куда-то отводить); В) катастрофически низкой производительности каждого отдельного ядра по сравнению с производительностью ядер современных центральных процессоров даже при равной частоте. В итоге: сия система не годится ни в роли "параллельной числодробилки" (где её обставит даже слабая видюха АМД или Невидии), ни в роли обычного центрального процессора (где она вчистую проиграет обычным Коре и7). Связка из Коре и7 и топовой видюхи от Невидии однозначно будет многократно (примерно от 10 до 1000 раз) быстрее, чем Ларабее, на абсолютно любых видах задач.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 19:04 

Зарегистрирован: 18 апр 2010, 15:59
Сообщения: 155
Смущает только один вопрос. Почему же, если полномасштабный переход на массивно параллельный компьютер сулит такие большие преимущества в производительности и сдерживается только необходимостью подключения GPU к системной шине в качестве мастера, этого до сих не то что никто не сделал, но даже и не пытался сделать? До сих если я чего-то не упустил, никто не порывался на такой прорывной шаг. Значит, по-видимому есть кирпичи мешающие такому переходу и помимо подключению к шине. До сих пор я не слышал, чтобы GPU использовались для чего-нибудь отличного от довольно узкого спектра задач связанного с выполнением однообразных действий над большими объемами данных. То есть произвести много различных, независимых между собой действий, над совершенно отличными данными, не связанными между собой.

Если влепить на место видеокарты Larabee, то мы ТЕОРЕТИЧЕСКИ получим систему состоящую из множества упрощенных прикладных процессоров, способных решать любые задачи, в любом объеме и с большой динамикой, аналогичного, но более навороченного процессора исполняющего роль моста ввода вывода и всей переферии. Любое из Larabbe ядер дергает IO процессор через IPI. тот в свою очередь дергает любую периферию. В чем проблема?

SII писал(а):
А "все вытекающие" из впендюривания ядер Пентиума заключаются в: А) катастрофически огромных размерах каждого процессорного ядра по сравнению с ядрами графических процессоров, из-за чего их уместится на одном кристалле на два порядка меньше; Б) проистекающей из пункта А катастрофически низкой производительности на параллельных вычислениях (как минимум на те же два порядка ниже, чем у обычных ГП -- и это без учёта того, что более сложное ядро труднее разогнать по частоте, а потребляет оно больше энергии, которую ещё нужно куда-то отводить); В) катастрофически низкой производительности каждого отдельного ядра по сравнению с производительностью ядер современных центральных процессоров даже при равной частоте. В итоге: сия система не годится ни в роли "параллельной числодробилки" (где её обставит даже слабая видюха АМД или Невидии), ни в роли обычного центрального процессора (где она вчистую проиграет обычным Коре и7). Связка из Коре и7 и топовой видюхи от Невидии однозначно будет многократно (примерно от 10 до 1000 раз) быстрее, чем Ларабее, на абсолютно любых видах задач.

А) Я извиняюсь, но вы по техпроцессу каких годов считали площадь ядра Pentium? Например Pentium II процессор использует около 7.5 миллиона транзисторов при техпроцессе 0,35 мкм. Современный Core I7 содержит около 780 миллионов транзисторов при тех процессе в 45 нм. При этом ничего не мешает GF480 содержать около 3 млрд. транзисторов. Сами прикиньте сколько их можно влепить на ту же площадь при современном техпроцессе. Хотя вероятно и меньше чем GPU-шных ядер.
Б) При неудачном развитии событий вероятно что вы окажетесь правы. Но вы упускаете один момент на Larrabe я смогу решать сто разных задач одновременно, а не одну задачу, но над большим объемом данных. По поводу потребления энергии, хочу отметить, что если повышение частоты негативно влияет на тепловыделение, то уменьшение техпроцесса влияет на него положительно. Хотя и влияние архитектуры традиционно остается сильным. Так что, по крайней мне сложно судить о предельных частотах Pentium-а сделанного по 40нм техпроцессу.
В) Да по сравнению, с ЦП он будет намного менее производительным (да более тугой конвеер, да не может выполнять сто-пицот инструкций за такт). Но зато их много. Я как понимаю, что и потоковый процессор GPU, сам по отдельности выдаст крайне скудные показатели производительности.


P.S.: Давайте на скатывать беседу на холивар. Меня интересует каким будет будущее развитие компьютерных систем, а не возможность задрать нос или выпятить грудь, и ваша точка зрения для меня тоже интересна. Если вам есть что рассказать, то рассказывайте, с удовольствием почитаю. Если где-то видели интересный материал - киньте ссылку, буду благодарен. Нас здесь мало, поэтому давайте сохраним дружелюбную атмосферу профессионального клуба.

Спасибо за внимание.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 19:46 
Аватара пользователя

Зарегистрирован: 16 май 2007, 23:46
Сообщения: 1126
А) Не в количестве транзисторах дело, а в задержках при связях между ними. А во вторых возьми и посчитай их будет меньше. Взаимодействия между ними хужи.

Б) Тенденций развития вам неизвестны.
Цитата:
, то уменьшение техпроцесса влияет на него положительно.
Это было до поры до времени но уже при 45нм из за квантовых эффектов даёт обратный эффект. И теперь энергопотребление снижают другими методами новые материалы, смена форма транзистора.
В) Тут вы абсолютно неправы.

Цитата:
P.S.: Давайте на скатывать беседу на холивар. Меня интересует каким будет будущее развитие компьютерных систем, а не возможность задрать нос или выпятить грудь, и ваша точка зрения для меня тоже интересна. Если вам есть что рассказать, то рассказывайте, с удовольствием почитаю. Если где-то видели интересный материал - киньте ссылку, буду благодарен. Нас здесь мало, поэтому давайте сохраним дружелюбную атмосферу профессионального клуба.

Трудно отгадать тут больше вопрос маркетологов, как скажут так и будет. На ближайшие 20 лет уменьшение технологическим норм. Увеличения числа ядер. Доведения исполнения инструкций до 0.1 такта.

Цитата:
Почему же, если полномасштабный переход на массивно параллельный компьютер сулит такие большие преимущества в производительности и сдерживается только необходимостью подключения GPU к системной шине в качестве мастера, этого до сих не то что никто не сделал, но даже и не пытался сделать?

Внимательнее читай что пишут другие. SII не писал что параллельность, сулит большое преимущество.
Параллельность была придумана ещё в 60годах прошлого века. И она используется. Вот только не на ПК.
По поводу того что не пытаются. Делают, но у AMD по плану лет через 5 не раньше. На ixbt видел картинку с планом.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 19:52 
Аватара пользователя

Зарегистрирован: 16 май 2007, 23:46
Сообщения: 1126
Цитата:
Могут ли потоковые процессоры в GPU исполнять различные нити кода, обмениваться данными, хэндлить ввод-вывод?

1) NVidea не уверен, но вроде Да у AMD в планах.
2) Да.
3) SII всё чётко описал. Но отвечу что я считаю что может. ДА осложнено, но возможно. Я это уже писал это на другом форуме, но доказывать это в ближайшее время не собираюсь.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 20:33 

Зарегистрирован: 28 окт 2007, 18:33
Сообщения: 1418
ZarathustrA писал(а):
Смущает только один вопрос. Почему же, если полномасштабный переход на массивно параллельный компьютер сулит такие большие преимущества в производительности и сдерживается только необходимостью подключения GPU к системной шине в качестве мастера, этого до сих не то что никто не сделал, но даже и не пытался сделать?


"Полномасштабный переход" отнюдь не сулит "такие большие преимущества", потому что большое количество (сотни, тысячи) вычислительных ядер дают это самое преимущество только лишь достаточно узкому кругу задач. Очень многие задачи просто не распараллеливаются либо распараллеливание даёт выгоду лишь до определённого предела, а посему для процессора общего назначения очень важна индивидуальная производительность одного ядра. Core i3/i5/i7 на сегодняшний день, вероятно, являются наиболее производительными ядрами общего назначения, а вот ядро Пентиума таковым даже близко не является даже на одинаковых с Коре частотах: оно банально безнадёжно устаревшее внутри. Поэтому, чтобы на одном и том же компьютере можно было достаточно эффективно решать разные задачи, требуется и высокопроизводительный ЦП общего назначения, и высокопроизводительная "числодробилка", в роли которой успешно выступает "видюха". Правда, если ограничиваться только "числодроблением", то производительность специализированного процессора можно ещё более повысить по сравнению с ГП: надо повыкидывать сугубо "графические" блоки, увеличив количество вычислителей. Но такое решение для визуализации окажется хуже, поскольку "графические" блоки с большей эффективностью выполняют ряд задач, которые иначе придётся делать программным образом.

Цитата:
Если влепить на место видеокарты Larabee, то мы ТЕОРЕТИЧЕСКИ получим систему состоящую из множества упрощенных прикладных процессоров, способных решать любые задачи, в любом объеме и с большой динамикой, аналогичного, но более навороченного процессора исполняющего роль моста ввода вывода и всей переферии. Любое из Larabbe ядер дергает IO процессор через IPI. тот в свою очередь дергает любую периферию. В чем проблема?


Вы хоть читаете, о чём другие пишут? Ларабее будет безусловно медленнее ГП а-ля Невидия/АМД, поскольку будет иметь намного меньше вычислительных ядер, к тому же пожирающих намного больше энергии (из-за их более высокой сложности), а значит, безнадёжно проиграет означенным ГП на любой "параллельной" задаче. В то же время он не менее безнадёжно проиграет ядру современного процессора Коре на задачах, не поддающихся распараллеливанию. Так какой смысл в применении Ларабее, если он всегда, в любых условиях будет хуже?

Цитата:
А) Я извиняюсь, но вы по техпроцессу каких годов считали площадь ядра Pentium? Например Pentium II процессор использует около 7.5 миллиона транзисторов при техпроцессе 0,35 мкм. Современный Core I7 содержит около 780 миллионов транзисторов при тех процессе в 45 нм. При этом ничего не мешает GF480 содержать около 3 млрд. транзисторов. Сами прикиньте сколько их можно влепить на ту же площадь при современном техпроцессе. Хотя вероятно и меньше чем GPU-шных ядер.


Ещё раз: сначала изучайте матчасть, т.е. электронику в данном случае, потом хорошенько подумайте, ну а уж затем, если так хочется, несите ерунду. Подсказка: сравните объёмы кэш-памяти различных процессоров и вычтите потребные на них транзисторы из общего объёма, потом вычтите расходы на всякие дополнительные блоки (контроллер памяти, контроллер шины и т.п.), а потом уж поделите оставшееся число на количество вычислительных ядер -- и тогда сможете узнать, сколько транзисторов требуется для одного ядра.

Цитата:
Б) При неудачном развитии событий вероятно что вы окажетесь правы. Но вы упускаете один момент на Larrabe я смогу решать сто разных задач одновременно, а не одну задачу, но над большим объемом данных.


1. Часто ли возникает нужда решать 100 задач одновременно? На домашних ПК -- никогда. Такое бывает нужно только крупным серверам, но там препятствием будут пропускная способность памяти и ввода-вывода, поэтому архитектурно они строятся совершенно иначе.

2. А с чего Вы взяли, что на ГП можно решать только одну задачу? Подробности я не помню (можно поискать, только вот лениво), однако точно помню, что над одной задачей трудится лишь сравнительно небольшая группа вычислительных ядер одновременно -- то ли 16, то ли 32. Если у АМДшных ГП этих ядер до 1600, легко вычислить, сколько параллельно можно считать разных задач. У Невидии ситуация аналогична, просто там по-другому считается количество ядер, поэтому на первый взгляд может показаться, что их намного меньше, чем у АМД. Кстати говоря, АМДшные ГП, обгоняя Невидийные по "чистой" производительности, прилично проигрывают на сложных программах с ветвлениями: у них это вызывает куда большую потерю производительности.

Цитата:
По поводу потребления энергии, хочу отметить, что если повышение частоты негативно влияет на тепловыделение, то уменьшение техпроцесса влияет на него положительно. Хотя и влияние архитектуры традиционно остается сильным. Так что, по крайней мне сложно судить о предельных частотах Pentium-а сделанного по 40нм техпроцессу.


Современные процессоры выпускаются по 32-нм техпроцессу. Предельные штатные частоты -- что-то вроде 3,7 ГГц, с разгоном поднимается несколько выше 4, если не применять специальное охлаждение. У примитивного Пентиума частота, вероятно, будет несколько выше, хотя индивидуальная производительность -- много хуже, чем у Коре и7 (малое количество исполнительных устройств, предсказание ветвлений, стек предсказания возвратов и т.д. и т.п.).

Цитата:
В) Да по сравнению, с ЦП он будет намного менее производительным (да более тугой конвеер, да не может выполнять сто-пицот инструкций за такт). Но зато их много. Я как понимаю, что и потоковый процессор GPU, сам по отдельности выдаст крайне скудные показатели производительности.


Ещё раз. Есть задачи, поддающиеся распараллеливанию, а есть -- не поддающиеся. Ларабее будет плохо справляться и с теми, и с другими, если его сравнивать с современными процессорами, ориентированными на эти классы задач, а потому у него просто нет места.

Цитата:
P.S.: Давайте на скатывать беседу на холивар. Меня интересует каким будет будущее развитие компьютерных систем, а не возможность задрать нос или выпятить грудь, и ваша точка зрения для меня тоже интересна. Если вам есть что рассказать, то рассказывайте, с удовольствием почитаю. Если где-то видели интересный материал - киньте ссылку, буду благодарен. Нас здесь мало, поэтому давайте сохраним дружелюбную атмосферу профессионального клуба.


Холивара никакого нет. А вот отсутствие этого самого профессионализма вкупе с нежеланием вникать в тему, зато с кучей высосанных из пальца (с аргументацией "мне кажется" или "об этом пишут") заявлений мне, мягко говоря, не нравятся, причём второе и третье -- куда больше (поскольку профессионализм можно приобрести, если работать в этом направлении, а вот нежелание что-либо учить, подменяя пустрым трёпом... был тут такой деятель -- Зуров, можете поспрашивать старожилов про него. Да и приснопоминаемого Махимыча можно вспомнить).

Пы.Сы. Ничего личного, было бы личное -- давно бы забанил, яко особо злобный админ :)))

Пы.Пы.Сы. Рассказать-то есть что, да особо времени нет. Да и желания тоже: почти всё, что я могу рассказать, имеется в свободном доступе в Сети, надо лишь искать да читать. Но только не всякие рекламные брошюрки, анонсы и прочую пургу -- 95% там глупость, а остальные 5% -- прямая ложь. С тем же Ларабее: поищите, когда было последнее официальное упоминание о нём, а заодно найдите первое, посмотрите на данные там обещания, в т.ч. по срокам, ну и т.п.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 20 июл 2011, 21:37 

Зарегистрирован: 18 апр 2010, 15:59
Сообщения: 155
Ладно, завязываем. У меня такое ощущение что мы с вами как минимум смотрим на проблемное поле с противоположных сторон. И по-видимому пересказываем друг другу то что и так прекрасно знаем. Я понял и оценил вашу точку зрения. Из данного разговора я думаю больше ничего полезного не выйдет.

P.S.: Спасибо за дискуссию.


Вернуться к началу
 Профиль  
 
 Заголовок сообщения: Re: Аппаратная платформа под ОС
СообщениеДобавлено: 21 июл 2011, 19:16 
Аватара пользователя

Зарегистрирован: 14 мар 2011, 12:31
Сообщения: 970
Откуда: Дагоба
Если ориентироваться не на специальные проекты, типа суперкомпьютеров на уникальной архитектуре или управляющий ракетный комплекс, а на проект общего назначения, то здесь только две альтернативы (не важно, какие у них достоинства или недостатки) - x86 и ARM. Потому что эти две архитектуры вытеснили нафиг всё остальное. Первое в настольных ПК, второе в мобильных приложениях.

_________________
Yet Other Developer of Architecture.
The mistery of Yoda’s speech uncovered is:
Just an old Forth programmer Yoda was.

<<< OS Boot Tools. >>>


Вернуться к началу
 Профиль  
 
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 31 ]  На страницу Пред.  1, 2, 3, 4  След.

Часовой пояс: UTC + 3 часа


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Создано на основе phpBB® Forum Software © phpBB Group
Русская поддержка phpBB