Improve testing of `WorkerMetricCollector` · Issue #6943 · dask/distributed

The current testing of the WorkerMetricCollector is quite sparse:(

distributed/distributed/http/worker/tests/test_worker_http.py

Lines 11 to 29 in c15a10e

    
           @gen_cluster(client=True) 
        
           async def test_prometheus(c, s, a, b): 
        
               pytest.importorskip("prometheus_client") 
        
               from prometheus_client.parser import text_string_to_metric_families 
        
               http_client = AsyncHTTPClient() 
        
               # request data twice since there once was a case where metrics got registered 
        
               # multiple times resulting in prometheus_client errors 
        
               for _ in range(2): 
        
                   response = await http_client.fetch( 
        
                       "http://localhost:%d/metrics" % a.http_server.port 
        
                   ) 
        
                   assert response.code == 200 
        
                   assert response.headers["Content-Type"] == "text/plain; version=0.0.4" 
        
                   txt = response.body.decode("utf8") 
        
                   families = {familiy.name for familiy in text_string_to_metric_families(txt)} 
        
                   assert "dask_worker_latency_seconds" in families

in particular if compared to the SemaphoreMetricCollector:

distributed/distributed/http/scheduler/tests/test_semaphore_http.py

Lines 10 to 86 in c15a10e

    
           @gen_cluster(client=True, clean_kwargs={"threads": False}) 
        
           async def test_prometheus_collect_task_states(c, s, a, b): 
        
               pytest.importorskip("prometheus_client") 
        
               from prometheus_client.parser import text_string_to_metric_families 
        
               http_client = AsyncHTTPClient() 
        
               async def fetch_metrics(): 
        
                   port = s.http_server.port 
        
                   response = await http_client.fetch(f"http://localhost:{port}/metrics") 
        
                   txt = response.body.decode("utf8") 
        
                   families = { 
        
                       family.name: family 
        
                       for family in text_string_to_metric_families(txt) 
        
                       if family.name.startswith("dask_semaphore_") 
        
                   } 
        
                   return families 
        
               active_metrics = await fetch_metrics() 
        
               expected_metrics = { 
        
                   "dask_semaphore_max_leases", 
        
                   "dask_semaphore_active_leases", 
        
                   "dask_semaphore_pending_leases", 
        
                   "dask_semaphore_acquire", 
        
                   "dask_semaphore_release", 
        
                   "dask_semaphore_average_pending_lease_time_s", 
        
               } 
        
               assert active_metrics.keys() == expected_metrics 
        
               for v in active_metrics.values():  # Not yet any semaphore created 
        
                   assert v.samples == [] 
        
               sem = await Semaphore(name="test", max_leases=2) 
        
               active_metrics = await fetch_metrics() 
        
               assert active_metrics.keys() == expected_metrics 
        
               # Assert values are set upon intialization 
        
               for name, v in active_metrics.items(): 
        
                   samples = v.samples 
        
                   assert len(samples) == 1 
        
                   sample = samples.pop() 
        
                   assert sample.labels["name"] == "test" 
        
                   if name == "dask_semaphore_max_leases": 
        
                       assert sample.value == 2 
        
                   else: 
        
                       assert sample.value == 0 
        
               assert await sem.acquire() 
        
               active_metrics = await fetch_metrics() 
        
               assert active_metrics["dask_semaphore_max_leases"].samples[0].value == 2 
        
               assert active_metrics["dask_semaphore_active_leases"].samples[0].value == 1 
        
               assert ( 
        
                   active_metrics["dask_semaphore_average_pending_lease_time_s"].samples[0].value 
        
                   > 0 
        
               ) 
        
               assert active_metrics["dask_semaphore_acquire"].samples[0].value == 1 
        
               assert active_metrics["dask_semaphore_release"].samples[0].value == 0 
        
               assert active_metrics["dask_semaphore_pending_leases"].samples[0].value == 0 
        
               assert await sem.release() is True 
        
               active_metrics = await fetch_metrics() 
        
               assert active_metrics["dask_semaphore_max_leases"].samples[0].value == 2 
        
               assert active_metrics["dask_semaphore_active_leases"].samples[0].value == 0 
        
               assert ( 
        
                   active_metrics["dask_semaphore_average_pending_lease_time_s"].samples[0].value 
        
                   > 0 
        
               ) 
        
               assert active_metrics["dask_semaphore_acquire"].samples[0].value == 1 
        
               assert active_metrics["dask_semaphore_release"].samples[0].value == 1 
        
               assert active_metrics["dask_semaphore_pending_leases"].samples[0].value == 0 
        
               await sem.close() 
        
               active_metrics = await fetch_metrics() 
        
               assert active_metrics.keys() == expected_metrics 
        
               for v in active_metrics.values(): 
        
                   assert v.samples == []

We should improve the testing to ensure that users can rely upon this piece of monitoring infrastructure.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Uh oh!

Improve testing of `WorkerMetricCollector` #6943

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

	@gen_cluster(client=True)
	async def test_prometheus(c, s, a, b):
	pytest.importorskip("prometheus_client")
	from prometheus_client.parser import text_string_to_metric_families

	http_client = AsyncHTTPClient()

	# request data twice since there once was a case where metrics got registered
	# multiple times resulting in prometheus_client errors
	for _ in range(2):
	response = await http_client.fetch(
	"http://localhost:%d/metrics" % a.http_server.port
	)
	assert response.code == 200
	assert response.headers["Content-Type"] == "text/plain; version=0.0.4"

	txt = response.body.decode("utf8")
	families = {familiy.name for familiy in text_string_to_metric_families(txt)}
	assert "dask_worker_latency_seconds" in families

	@gen_cluster(client=True, clean_kwargs={"threads": False})
	async def test_prometheus_collect_task_states(c, s, a, b):
	pytest.importorskip("prometheus_client")
	from prometheus_client.parser import text_string_to_metric_families

	http_client = AsyncHTTPClient()

	async def fetch_metrics():
	port = s.http_server.port
	response = await http_client.fetch(f"http://localhost:{port}/metrics")
	txt = response.body.decode("utf8")
	families = {
	family.name: family
	for family in text_string_to_metric_families(txt)
	if family.name.startswith("dask_semaphore_")
	}
	return families

	active_metrics = await fetch_metrics()

	expected_metrics = {
	"dask_semaphore_max_leases",
	"dask_semaphore_active_leases",
	"dask_semaphore_pending_leases",
	"dask_semaphore_acquire",
	"dask_semaphore_release",
	"dask_semaphore_average_pending_lease_time_s",
	}

	assert active_metrics.keys() == expected_metrics
	for v in active_metrics.values(): # Not yet any semaphore created
	assert v.samples == []

	sem = await Semaphore(name="test", max_leases=2)

	active_metrics = await fetch_metrics()
	assert active_metrics.keys() == expected_metrics
	# Assert values are set upon intialization
	for name, v in active_metrics.items():
	samples = v.samples
	assert len(samples) == 1
	sample = samples.pop()
	assert sample.labels["name"] == "test"
	if name == "dask_semaphore_max_leases":
	assert sample.value == 2
	else:
	assert sample.value == 0

	assert await sem.acquire()
	active_metrics = await fetch_metrics()
	assert active_metrics["dask_semaphore_max_leases"].samples[0].value == 2
	assert active_metrics["dask_semaphore_active_leases"].samples[0].value == 1
	assert (
	active_metrics["dask_semaphore_average_pending_lease_time_s"].samples[0].value
	> 0
	)
	assert active_metrics["dask_semaphore_acquire"].samples[0].value == 1
	assert active_metrics["dask_semaphore_release"].samples[0].value == 0
	assert active_metrics["dask_semaphore_pending_leases"].samples[0].value == 0

	assert await sem.release() is True
	active_metrics = await fetch_metrics()
	assert active_metrics["dask_semaphore_max_leases"].samples[0].value == 2
	assert active_metrics["dask_semaphore_active_leases"].samples[0].value == 0
	assert (
	active_metrics["dask_semaphore_average_pending_lease_time_s"].samples[0].value
	> 0
	)
	assert active_metrics["dask_semaphore_acquire"].samples[0].value == 1
	assert active_metrics["dask_semaphore_release"].samples[0].value == 1
	assert active_metrics["dask_semaphore_pending_leases"].samples[0].value == 0

	await sem.close()
	active_metrics = await fetch_metrics()
	assert active_metrics.keys() == expected_metrics
	for v in active_metrics.values():
	assert v.samples == []

Uh oh!

Uh oh!

Improve testing of WorkerMetricCollector #6943

Description

Metadata

Metadata

Assignees

Labels

Type

Fields

Projects

Milestone

Relationships

Development

Issue actions

Improve testing of `WorkerMetricCollector` #6943