Скрипт Dtrace, который возвращает% CPU,% Memory и сеть в/из, агрегированные по зонам

Мне нужен сценарий DTrace, который возвращает процент использования процессора, процент использования памяти и используемые входные и выходные байты сети, агрегируя данные по зонам. Что-то вроде этого:

ZONE  %CPU %MEM NET_INPUT NET_OUTPUT
zone1 25%  12%   86012     1294
zone2 48%  65%   86012     7354
zone3  8%  14%  268153    68746

К настоящему времени я использую:

prstat -Z -c -n 1,99999 5 1

Это возвращает что-то подобное (без сетевого трафика):

Please wait...
   PID USERNAME  SIZE   RSS STATE  PRI NICE      TIME  CPU PROCESS/NLWP       
 32051 root     1090M 1079M sleep    1    0  12:57:25 0,4% qemu-system-x86/7
ZONEID    NPROC  SWAP   RSS MEMORY      TIME  CPU ZONE                        
  3228        2 1090M 1079M   2,2%  12:57:25 0,4% 6ce064b6-fec9-4daa-ba2b-0082f73fca73
     0      105 2075M  633M   1,1% 202:56:51 0,4% global                      
  3031        2 2105M 2094M   4,3%  17:04:52 0,3% e32fb987-35f7-4860-a04a-ca26c327d4ba
(...)
  3411       18   81M   54M   0,1%   0:00:04 0,0% 52120eb6-2e20-4a64-8f7a-235a44d9f100
Total: 894 processes, 5460 lwps, load averages: 0,53, 0,53, 0,54

Мне нужно получить то же самое, но сделать с DTrace, чтобы объединить данные с сетевым трафиком и больше зондов в будущем.

6
nl ja de
Вы просите о помощи при написании сценария, или вы просите кого-нибудь еще написать его для вас?
добавлено автор Gabe, источник
Любая помощь будет оценена по достоинству. Я сделал много тестовых скриптов, но никто из них не делает то, что мне нужно, поэтому я не публиковал их, чтобы предотвратить «шум».
добавлено автор greuze, источник
В настоящий момент я использую несколько команд solaris для получения данных (а не dtrace вообще).
добавлено автор greuze, источник

2 ответы

Причина, по которой такой скрипт еще не существует, заключается в том, что использование ЦП/памяти довольно сложно получить с помощью DTrace. DTrace лучше всего подходит для сбора данных по определенному событию. Чтобы получить использование ЦП с использованием DTrace, вам нужно будет отслеживать каждый раз, когда процессор становится свободным, и каждый раз, когда он становится занятым, а затем делает некоторое дополнение. Обратите внимание, что это отличается от поставщика, который DTrace предоставляет для операций планировщика отслеживания, поскольку они основаны на потоках, а не на каждом процессоре. Память еще более раздражает, так как вы будете отслеживать распределение и освобождение памяти.

Чтобы получить эти источники данных, вам может быть лучше обслуживать, потянув данные из kstat (похоже, что вы используете Solaris, AFAIK - единственная платформа с kstat ). Информацию, которую вы ищете, можно найти, используя ее так:

$ sudo kstat unix:0:system_misc:ncpus      # this is the number of CPUs you have
module: unix                            instance: 0     
name:   system_misc                     class:    misc
        ncpus                           2

$ sudo kstat cpu::sys:cpu_ticks*           # ticks of each type for each core since boot
module: cpu                             instance: 0     
name:   sys                             class:    misc
        cpu_ticks_idle                  9375292
        cpu_ticks_kernel                82658
        cpu_ticks_user                  23684
        cpu_ticks_wait                  0

module: cpu                             instance: 1     
name:   sys                             class:    misc
        cpu_ticks_idle                  9410367
        cpu_ticks_kernel                49141
        cpu_ticks_user                  21956
        cpu_ticks_wait                  0

$ sudo kstat unix:0:system_pages:physmem   # pages of physical memory (multiply by page size for number of bytes)
module: unix                            instance: 0     
name:   system_pages                    class:    pages
        physmem                         1045390

$ sudo kstat unix:0:system_pages:freemem   # pages of free memory (multiply by page size for number of bytes)
module: unix                            instance: 0     
name:   system_pages                    class:    pages
        freemem                         880842

Обратите внимание, что вам нужно вычитать каждое новое чтение из последнего показания для счетчиков тиков ЦП - в противном случае вы будете отслеживать общее количество тиков с момента загрузки системы. Когда счетчики переполняются, они устанавливаются в 0, а затем добавляется новое значение (это не просто избыточное переполнение).

Вы также можете использовать kstat для отслеживания количества байтов, считанных/записанных по сетевым ссылкам, с помощью ссылки : 0 :: . Я не уверен, что эта информация может быть найдена для каждой зоны, но, вероятно, есть и код kstat , который отслеживает это.

Я думаю, если бы вы решили использовать DTrace для контроля значений, вы можете заставить это сделать, отслеживая моменты, когда эти счетчики меняются в ядре и записывают изменения. Тем не менее, я действительно не вижу смысла в этом, так как проще использовать другие методы, как вы уже обнаружили. Почему бы не создать сценарий, который запускает оба источника данных и объединяет результаты во что-то приятнее?

5
добавлено

Взгляните на DTraceToolkit . Он имеет огромную коллекцию скриптов, которые используют различные пробники для выполнения широкого набора задач. Это может указать вам в правильном направлении.

1
добавлено
Когда я отправляю вопрос, я прочитал много сценариев от Брендана Грегга, но я не нашел то, что искал. Я нахожу способы получить количество раз, когда поток пришел в CPU, но не процент процессора, например.
добавлено автор greuze, источник
Мониторинг
Мониторинг
210 участник(ов)

Мониторинг, метрики, графики, логи, алерты. Всё, что так или иначе относится к процессу мониторинга: сбор данных, анализ, реакция на проблемы. Делимся опытом и не поливаем говном продукты (каждый хорош по-своему). Отдельно про Zabbix – @ZabbixPro