[PATCH 0/3] Add run time sysctl to enable/disable cluster scheduling

List overview All Threads
Download

newer

older

Re: [Linaro-open-discussions]...

LOC Monthly Meeting - Thursday...

Tim Chen

22 Jul 2021 22 Jul '21

7:36 a.m.

Barry & Yicong,

I've added this series to allow for run time control of cluster scheduling via /proc/sys/kernel/sched_cluster_enabled.

I've defaulted the setting to off as this is probably the safest option and will encounter the least resistance.

I've also added a SD_CLUSTER flag in patch 2. It may be handy if we want to do any cluster specific scheduling operation in a cluster sched domain.

This could be a follow on after the main patchset is posted. I've tested it on my x86 machine. Wonder if you can test it on your ARM system to make sure it works properly there.

Will appreciate your feedback and review.

Tim

Tim Chen (3): sched: Create SDTL_SKIP flag to skip topology level sched: Add SD_CLUSTER topology flag to cluster sched domain sched: Add runtime knob sysctl_sched_cluster_enabled

-- 2.20.1

Show replies by date

Tim Chen

22 Jul 22 Jul

7:36 a.m.

New subject: [PATCH 1/3] sched: Create SDTL_SKIP flag to skip topology level

If the system admin does not want to use cluster scheduling, we want to later allow cluster topology level to be skipped when building sched domains.

Create SDTL_SKIP bit on the sched_domain_topology_level flag so we can check if a topology level should be skipped when building sched domains. --- include/linux/sched/topology.h | 1 + kernel/sched/topology.c | 10 +++++++++- 2 files changed, 10 insertions(+), 1 deletion(-)

diff --git a/include/linux/sched/topology.h b/include/linux/sched/topology.h index 2f9166f6dec8..8ebabc0dffb3 100644 --- a/include/linux/sched/topology.h +++ b/include/linux/sched/topology.h @@ -182,6 +182,7 @@ typedef const struct cpumask *(*sched_domain_mask_f)(int cpu); typedef int (*sched_domain_flags_f)(void);

#define SDTL_OVERLAP 0x01 +#define SDTL_SKIP 0x02

struct sd_data { struct sched_domain *__percpu *sd; diff --git a/kernel/sched/topology.c b/kernel/sched/topology.c index c7523dc7aab7..22bf80d658c4 100644 --- a/kernel/sched/topology.c +++ b/kernel/sched/topology.c @@ -1526,8 +1526,16 @@ static struct sched_domain_topology_level default_topology[] = { static struct sched_domain_topology_level *sched_domain_topology = default_topology;

+static struct sched_domain_topology_level *next_tl(struct sched_domain_topology_level *tl) +{ + ++tl; + while (tl->mask && tl->flags & SDTL_SKIP) + ++tl; + return tl; +} + #define for_each_sd_topology(tl) \ - for (tl = sched_domain_topology; tl->mask; tl++) + for (tl = sched_domain_topology; tl->mask; tl = next_tl(tl))

void set_sched_topology(struct sched_domain_topology_level *tl) {

-- 2.20.1

Tim Chen

7:36 a.m.

New subject: [PATCH 2/3] sched: Add SD_CLUSTER topology flag to cluster sched domain

Add SD_CLUSTER to prepare flagging cluster sched domain topology later. System needs to know if a topology level is a cluster level that needs special handling based. Cluster domain should be built based on runtime configuration. --- include/linux/sched/sd_flags.h | 7 +++++++ include/linux/sched/topology.h | 2 +- kernel/sched/topology.c | 1 + 3 files changed, 9 insertions(+), 1 deletion(-)

diff --git a/include/linux/sched/sd_flags.h b/include/linux/sched/sd_flags.h index 34b21e971d77..ca7744119582 100644 --- a/include/linux/sched/sd_flags.h +++ b/include/linux/sched/sd_flags.h @@ -154,3 +154,10 @@ SD_FLAG(SD_OVERLAP, SDF_SHARED_PARENT | SDF_NEEDS_GROUPS) * NEEDS_GROUPS: No point in preserving domain if it has a single group. */ SD_FLAG(SD_NUMA, SDF_SHARED_PARENT | SDF_NEEDS_GROUPS) + +/* + * Domain members in the same CPU cluster + * + * NEEDS_GROUPS: Cluster resroucres are shared shared between groups. + */ +SD_FLAG(SD_CLUSTER, SDF_NEEDS_GROUPS) diff --git a/include/linux/sched/topology.h b/include/linux/sched/topology.h index 8ebabc0dffb3..5578aae00e82 100644 --- a/include/linux/sched/topology.h +++ b/include/linux/sched/topology.h @@ -45,7 +45,7 @@ static inline int cpu_smt_flags(void) #ifdef CONFIG_SCHED_CLUSTER static inline int cpu_cluster_flags(void) { - return SD_SHARE_PKG_RESOURCES; + return SD_CLUSTER | SD_SHARE_PKG_RESOURCES; } #endif

diff --git a/kernel/sched/topology.c b/kernel/sched/topology.c index 22bf80d658c4..b019129e515e 100644 --- a/kernel/sched/topology.c +++ b/kernel/sched/topology.c @@ -1393,6 +1393,7 @@ int __read_mostly node_reclaim_distance = RECLAIM_DISTANCE; #define TOPOLOGY_SD_FLAGS \ (SD_SHARE_CPUCAPACITY | \ SD_SHARE_PKG_RESOURCES | \ + SD_CLUSTER | \ SD_NUMA | \ SD_ASYM_PACKING)

-- 2.20.1

Tim Chen

7:36 a.m.

New subject: [PATCH 3/3] sched: Add runtime knob sysctl_sched_cluster_enabled

Allow the sys admin to change during run time whether cluster scheduling should be used. The setting can be changed via the sysctl variable /proc/sys/kernel/sched_cluster_enabled Setting it to 1 enable cluster scheduling and setting it to 0 turns it off.

Cluster scheduling should benefit independant tasks by load balancing them between clusters, allowing less contention on cluster resources. However, the extra load balancing overhead may degrade some workload and the default setting is off. --- arch/x86/kernel/smpboot.c | 8 ++++++ drivers/base/arch_topology.c | 7 ++++++ include/linux/sched/sysctl.h | 6 +++++ include/linux/topology.h | 7 ++++++ kernel/sched/core.c | 1 + kernel/sched/sched.h | 6 +++++ kernel/sched/topology.c | 47 ++++++++++++++++++++++++++++++++++++ kernel/sysctl.c | 11 +++++++++ 8 files changed, 93 insertions(+)

diff --git a/arch/x86/kernel/smpboot.c b/arch/x86/kernel/smpboot.c index 3162d0fc6b3c..9c31030bb784 100644 --- a/arch/x86/kernel/smpboot.c +++ b/arch/x86/kernel/smpboot.c @@ -57,6 +57,7 @@ #include <linux/pgtable.h> #include <linux/overflow.h> #include <linux/syscore_ops.h> +#include <linux/cpuset.h>

#include <asm/acpi.h> #include <asm/desc.h> @@ -127,6 +128,13 @@ int arch_update_cpu_topology(void) return retval; }

+void arch_rebuild_cpu_topology(void) +{ + x86_topology_update = true; + rebuild_sched_domains(); + x86_topology_update = false; +} + static inline void smpboot_setup_warm_reset_vector(unsigned long start_eip) { unsigned long flags; diff --git a/drivers/base/arch_topology.c b/drivers/base/arch_topology.c index 0e1070aec26c..756643303dea 100644 --- a/drivers/base/arch_topology.c +++ b/drivers/base/arch_topology.c @@ -191,6 +191,13 @@ int topology_update_cpu_topology(void) return update_topology; }

+void __weak arch_rebuild_cpu_topology(void) +{ + update_topology = 1; + rebuild_sched_domains(); + update_topology = 0; +} + /* * Updating the sched_domains can't be done directly from cpufreq callbacks * due to locking, so queue the work for later. diff --git a/include/linux/sched/sysctl.h b/include/linux/sched/sysctl.h index db2c0f34aaaf..b8e3a9136875 100644 --- a/include/linux/sched/sysctl.h +++ b/include/linux/sched/sysctl.h @@ -93,6 +93,12 @@ int sysctl_numa_balancing(struct ctl_table *table, int write, void *buffer, int sysctl_schedstats(struct ctl_table *table, int write, void *buffer, size_t *lenp, loff_t *ppos);

+#ifdef CONFIG_SCHED_CLUSTER +extern unsigned int sysctl_sched_cluster_enabled; +int sched_cluster_handler(struct ctl_table *table, int write, + void *buffer, size_t *lenp, loff_t *ppos); +#endif + #if defined(CONFIG_ENERGY_MODEL) && defined(CONFIG_CPU_FREQ_GOV_SCHEDUTIL) extern unsigned int sysctl_sched_energy_aware; int sched_energy_aware_handler(struct ctl_table *table, int write, diff --git a/include/linux/topology.h b/include/linux/topology.h index 0b3704ad13c8..e1609ff27baf 100644 --- a/include/linux/topology.h +++ b/include/linux/topology.h @@ -44,6 +44,7 @@ if (nr_cpus_node(node))

int arch_update_cpu_topology(void); +void arch_rebuild_cpu_topology(void);

/* Conform to ACPI 2.0 SLIT distance definitions */ #define LOCAL_DISTANCE 10 @@ -219,6 +220,12 @@ static inline const struct cpumask *cpu_cluster_mask(int cpu) } #endif

+#ifdef CONFIG_SCHED_CLUSTER +#define use_sched_cluster sysctl_sched_cluster_enabled +#else +#define use_sched_cluster 0 +#endif + static inline const struct cpumask *cpu_cpu_mask(int cpu) { return cpumask_of_node(cpu_to_node(cpu)); diff --git a/kernel/sched/core.c b/kernel/sched/core.c index 5226cc26a095..a180f10f9ffc 100644 --- a/kernel/sched/core.c +++ b/kernel/sched/core.c @@ -8033,6 +8033,7 @@ int sched_cpu_dying(unsigned int cpu) void __init sched_init_smp(void) { sched_init_numa(); + set_sched_cluster();

/* * There's no userspace yet to cause hotplug operations; hence all the diff --git a/kernel/sched/sched.h b/kernel/sched/sched.h index a189bec13729..8ad85b971dbc 100644 --- a/kernel/sched/sched.h +++ b/kernel/sched/sched.h @@ -1379,6 +1379,12 @@ this_rq_lock_irq(struct rq_flags *rf) return rq; }

+#ifdef CONFIG_SCHED_CLUSTER +extern void set_sched_cluster(void); +#else +static inline set_sched_cluster(void) { } +#endif + #ifdef CONFIG_NUMA enum numa_topology_type { NUMA_DIRECT, diff --git a/kernel/sched/topology.c b/kernel/sched/topology.c index b019129e515e..90a1f71d9de7 100644 --- a/kernel/sched/topology.c +++ b/kernel/sched/topology.c @@ -9,6 +9,8 @@ DEFINE_MUTEX(sched_domains_mutex); /* Protected by sched_domains_mutex: */ static cpumask_var_t sched_domains_tmpmask; static cpumask_var_t sched_domains_tmpmask2; +/* set via /proc/sys/kernel/sched_cluster_enabled */ +unsigned int __read_mostly sysctl_sched_cluster_enabled;

#ifdef CONFIG_SCHED_DEBUG

@@ -205,6 +207,34 @@ sd_parent_degenerate(struct sched_domain *sd, struct sched_domain *parent) return 1; }

+#ifdef CONFIG_SCHED_CLUSTER +void set_sched_cluster(void); + +DEFINE_MUTEX(sched_cluster_mutex); +int sched_cluster_handler(struct ctl_table *table, int write, + void *buffer, size_t *lenp, loff_t *ppos) +{ + int ret; + unsigned int oldval; + + if (write && !capable(CAP_SYS_ADMIN)) + return -EPERM; + + mutex_lock(&sched_cluster_mutex); + oldval = sysctl_sched_cluster_enabled; + ret = proc_dointvec_minmax(table, write, buffer, lenp, ppos); + if (!ret && write) { + if (oldval != sysctl_sched_cluster_enabled) { + set_sched_cluster(); + arch_rebuild_cpu_topology(); + } + } + mutex_unlock(&sched_cluster_mutex); + + return ret; +} +#endif + #if defined(CONFIG_ENERGY_MODEL) && defined(CONFIG_CPU_FREQ_GOV_SCHEDUTIL) DEFINE_STATIC_KEY_FALSE(sched_energy_present); unsigned int sysctl_sched_energy_aware = 1; @@ -1527,6 +1557,23 @@ static struct sched_domain_topology_level default_topology[] = { static struct sched_domain_topology_level *sched_domain_topology = default_topology;

+#ifdef CONFIG_SCHED_CLUSTER +void set_sched_cluster(void) +{ + struct sched_domain_topology_level *tl; + + for (tl = sched_domain_topology; tl->mask; tl++) { + if (tl->sd_flags && (tl->sd_flags() & SD_CLUSTER)) { + if (!sysctl_sched_cluster_enabled) + tl->flags |= SDTL_SKIP; + else + tl->flags &= ~SDTL_SKIP; + break; + } + } +} +#endif + static struct sched_domain_topology_level *next_tl(struct sched_domain_topology_level *tl) { ++tl; diff --git a/kernel/sysctl.c b/kernel/sysctl.c index d4a78e08f6d8..7cd8f10bf953 100644 --- a/kernel/sysctl.c +++ b/kernel/sysctl.c @@ -1848,6 +1848,17 @@ static struct ctl_table kern_table[] = { .extra2 = SYSCTL_ONE, }, #endif +#ifdef CONFIG_SCHED_CLUSTER + { + .procname = "sched_cluster_enabled", + .data = &sysctl_sched_cluster_enabled, + .maxlen = sizeof(unsigned int), + .mode = 0644, + .proc_handler = sched_cluster_handler, + .extra1 = SYSCTL_ZERO, + .extra2 = SYSCTL_ONE, + }, +#endif #ifdef CONFIG_PROVE_LOCKING { .procname = "prove_locking",

-- 2.20.1

Yicong Yang

10:46 p.m.

New subject: [PATCH 3/3] sched: Add runtime knob sysctl_sched_cluster_enabled

On 2021/7/22 3:36, Tim Chen wrote:

...

Allow the sys admin to change during run time whether cluster scheduling should be used. The setting can be changed via the sysctl variable /proc/sys/kernel/sched_cluster_enabled Setting it to 1 enable cluster scheduling and setting it to 0 turns it off.

Cluster scheduling should benefit independant tasks by load balancing them between clusters, allowing less contention on cluster resources. However, the extra load balancing overhead may degrade some workload and the default setting is off.

arch/x86/kernel/smpboot.c | 8 ++++++ drivers/base/arch_topology.c | 7 ++++++ include/linux/sched/sysctl.h | 6 +++++ include/linux/topology.h | 7 ++++++ kernel/sched/core.c | 1 + kernel/sched/sched.h | 6 +++++ kernel/sched/topology.c | 47 ++++++++++++++++++++++++++++++++++++ kernel/sysctl.c | 11 +++++++++ 8 files changed, 93 insertions(+)

diff --git a/arch/x86/kernel/smpboot.c b/arch/x86/kernel/smpboot.c index 3162d0fc6b3c..9c31030bb784 100644 --- a/arch/x86/kernel/smpboot.c +++ b/arch/x86/kernel/smpboot.c @@ -57,6 +57,7 @@ #include <linux/pgtable.h> #include <linux/overflow.h> #include <linux/syscore_ops.h> +#include <linux/cpuset.h> #include <asm/acpi.h> #include <asm/desc.h> @@ -127,6 +128,13 @@ int arch_update_cpu_topology(void) return retval; } +void arch_rebuild_cpu_topology(void) +{

x86_topology_update = true;

rebuild_sched_domains();

x86_topology_update = false;

+}

static inline void smpboot_setup_warm_reset_vector(unsigned long start_eip) { unsigned long flags; diff --git a/drivers/base/arch_topology.c b/drivers/base/arch_topology.c index 0e1070aec26c..756643303dea 100644 --- a/drivers/base/arch_topology.c +++ b/drivers/base/arch_topology.c @@ -191,6 +191,13 @@ int topology_update_cpu_topology(void) return update_topology; } +void __weak arch_rebuild_cpu_topology(void) +{

update_topology = 1;

rebuild_sched_domains();

update_topology = 0;

+}

/*

Updating the sched_domains can't be done directly from cpufreq callbacks

due to locking, so queue the work for later.

diff --git a/include/linux/sched/sysctl.h b/include/linux/sched/sysctl.h index db2c0f34aaaf..b8e3a9136875 100644 --- a/include/linux/sched/sysctl.h +++ b/include/linux/sched/sysctl.h @@ -93,6 +93,12 @@ int sysctl_numa_balancing(struct ctl_table *table, int write, void *buffer, int sysctl_schedstats(struct ctl_table *table, int write, void *buffer, size_t *lenp, loff_t *ppos); +#ifdef CONFIG_SCHED_CLUSTER +extern unsigned int sysctl_sched_cluster_enabled; +int sched_cluster_handler(struct ctl_table *table, int write,
void *buffer, size_t *lenp, loff_t *ppos);
+#endif

#if defined(CONFIG_ENERGY_MODEL) && defined(CONFIG_CPU_FREQ_GOV_SCHEDUTIL) extern unsigned int sysctl_sched_energy_aware; int sched_energy_aware_handler(struct ctl_table *table, int write, diff --git a/include/linux/topology.h b/include/linux/topology.h index 0b3704ad13c8..e1609ff27baf 100644 --- a/include/linux/topology.h +++ b/include/linux/topology.h @@ -44,6 +44,7 @@ if (nr_cpus_node(node)) int arch_update_cpu_topology(void); +void arch_rebuild_cpu_topology(void); /* Conform to ACPI 2.0 SLIT distance definitions */ #define LOCAL_DISTANCE 10 @@ -219,6 +220,12 @@ static inline const struct cpumask *cpu_cluster_mask(int cpu) } #endif +#ifdef CONFIG_SCHED_CLUSTER +#define use_sched_cluster sysctl_sched_cluster_enabled +#else +#define use_sched_cluster 0 +#endif

static inline const struct cpumask *cpu_cpu_mask(int cpu) { return cpumask_of_node(cpu_to_node(cpu)); diff --git a/kernel/sched/core.c b/kernel/sched/core.c index 5226cc26a095..a180f10f9ffc 100644 --- a/kernel/sched/core.c +++ b/kernel/sched/core.c @@ -8033,6 +8033,7 @@ int sched_cpu_dying(unsigned int cpu) void __init sched_init_smp(void) { sched_init_numa();

set_sched_cluster();

/* * There's no userspace yet to cause hotplug operations; hence all the diff --git a/kernel/sched/sched.h b/kernel/sched/sched.h index a189bec13729..8ad85b971dbc 100644 --- a/kernel/sched/sched.h +++ b/kernel/sched/sched.h @@ -1379,6 +1379,12 @@ this_rq_lock_irq(struct rq_flags *rf) return rq; } +#ifdef CONFIG_SCHED_CLUSTER +extern void set_sched_cluster(void); +#else +static inline set_sched_cluster(void) { }

should be:

static inline void set_sched_cluster(void)

...

+#endif

#ifdef CONFIG_NUMA enum numa_topology_type { NUMA_DIRECT, diff --git a/kernel/sched/topology.c b/kernel/sched/topology.c index b019129e515e..90a1f71d9de7 100644 --- a/kernel/sched/topology.c +++ b/kernel/sched/topology.c @@ -9,6 +9,8 @@ DEFINE_MUTEX(sched_domains_mutex); /* Protected by sched_domains_mutex: */ static cpumask_var_t sched_domains_tmpmask; static cpumask_var_t sched_domains_tmpmask2; +/* set via /proc/sys/kernel/sched_cluster_enabled */ +unsigned int __read_mostly sysctl_sched_cluster_enabled; #ifdef CONFIG_SCHED_DEBUG @@ -205,6 +207,34 @@ sd_parent_degenerate(struct sched_domain *sd, struct sched_domain *parent) return 1; } +#ifdef CONFIG_SCHED_CLUSTER +void set_sched_cluster(void);

+DEFINE_MUTEX(sched_cluster_mutex); +int sched_cluster_handler(struct ctl_table *table, int write,
void *buffer, size_t *lenp, loff_t *ppos)
+{
int ret;

unsigned int oldval;

if (write && !capable(CAP_SYS_ADMIN))
return -EPERM;
mutex_lock(&sched_cluster_mutex);

oldval = sysctl_sched_cluster_enabled;

ret = proc_dointvec_minmax(table, write, buffer, lenp, ppos);

if (!ret && write) {
if (oldval != sysctl_sched_cluster_enabled) {
	set_sched_cluster();
	arch_rebuild_cpu_topology();
}
}

mutex_unlock(&sched_cluster_mutex);

return ret;
+} +#endif

#if defined(CONFIG_ENERGY_MODEL) && defined(CONFIG_CPU_FREQ_GOV_SCHEDUTIL) DEFINE_STATIC_KEY_FALSE(sched_energy_present); unsigned int sysctl_sched_energy_aware = 1; @@ -1527,6 +1557,23 @@ static struct sched_domain_topology_level default_topology[] = { static struct sched_domain_topology_level *sched_domain_topology = default_topology; +#ifdef CONFIG_SCHED_CLUSTER +void set_sched_cluster(void) +{
struct sched_domain_topology_level *tl;

for (tl = sched_domain_topology; tl->mask; tl++) {
if (tl->sd_flags && (tl->sd_flags() & SD_CLUSTER)) {
	if (!sysctl_sched_cluster_enabled)
		tl->flags |= SDTL_SKIP;
	else
		tl->flags &= ~SDTL_SKIP;
	break;
}
}
+} +#endif

static struct sched_domain_topology_level *next_tl(struct sched_domain_topology_level *tl) { ++tl; diff --git a/kernel/sysctl.c b/kernel/sysctl.c index d4a78e08f6d8..7cd8f10bf953 100644 --- a/kernel/sysctl.c +++ b/kernel/sysctl.c @@ -1848,6 +1848,17 @@ static struct ctl_table kern_table[] = { .extra2 = SYSCTL_ONE, }, #endif +#ifdef CONFIG_SCHED_CLUSTER
{
.procname	= "sched_cluster_enabled",
.data		= &sysctl_sched_cluster_enabled,
.maxlen		= sizeof(unsigned int),
.mode		= 0644,
.proc_handler	= sched_cluster_handler,
.extra1		= SYSCTL_ZERO,
.extra2		= SYSCTL_ONE,
},
+#endif #ifdef CONFIG_PROVE_LOCKING { .procname = "prove_locking",

Tim Chen

23 Jul 23 Jul

3:39 a.m.

New subject: [PATCH 3/3] sched: Add runtime knob sysctl_sched_cluster_enabled

On 7/22/21 3:46 AM, Yicong Yang wrote:

...

...
+#ifdef CONFIG_SCHED_CLUSTER +extern void set_sched_cluster(void); +#else +static inline set_sched_cluster(void) { }

should be:

static inline void set_sched_cluster(void)

Yup. Thanks for catching this.

Tim

Yicong Yang

22 Jul 22 Jul

11:01 p.m.

Hi Tim,

On 2021/7/22 3:36, Tim Chen wrote:

...

Barry & Yicong,

I've added this series to allow for run time control of cluster scheduling via /proc/sys/kernel/sched_cluster_enabled.

I've defaulted the setting to off as this is probably the safest option and will encounter the least resistance.

I've also added a SD_CLUSTER flag in patch 2. It may be handy if we want to do any cluster specific scheduling operation in a cluster sched domain.

This could be a follow on after the main patchset is posted. I've tested it on my x86 machine. Wonder if you can test it on your ARM system to make sure it works properly there.

Will appreciate your feedback and review.

I've tested the series on our Kunpeng 920, the sysctl works as well.

One minor question is that if the user want to boot with cluster scheduler enabled, seems we have to boot with aditional sysctl.kernel.sched_cluster_enabled=1 appended in the cmdline. Then we'll build the domians without cluster scheduler first and rebuild the domains later, is this as expected? Can we provide a way to build the domains once with or without the cluster scheduling at boot time, like kernel parameters? just some trivial thoughts. :)

Thanks, Yicong

...

Tim

Tim Chen (3): sched: Create SDTL_SKIP flag to skip topology level sched: Add SD_CLUSTER topology flag to cluster sched domain sched: Add runtime knob sysctl_sched_cluster_enabled

arch/x86/kernel/smpboot.c | 8 +++++ drivers/base/arch_topology.c | 7 ++++ include/linux/sched/sd_flags.h | 7 ++++ include/linux/sched/sysctl.h | 6 ++++ include/linux/sched/topology.h | 3 +- include/linux/topology.h | 7 ++++ kernel/sched/core.c | 1 + kernel/sched/sched.h | 6 ++++ kernel/sched/topology.c | 58 +++++++++++++++++++++++++++++++++- kernel/sysctl.c | 11 +++++++ 10 files changed, 112 insertions(+), 2 deletions(-)

Tim Chen

23 Jul 23 Jul

3:41 a.m.

On 7/22/21 4:01 AM, Yicong Yang wrote:

...

Hi Tim,

On 2021/7/22 3:36, Tim Chen wrote:

...
Barry & Yicong,

I've added this series to allow for run time control of cluster scheduling via /proc/sys/kernel/sched_cluster_enabled.

I've defaulted the setting to off as this is probably the safest option and will encounter the least resistance.

I've also added a SD_CLUSTER flag in patch 2. It may be handy if we want to do any cluster specific scheduling operation in a cluster sched domain.

This could be a follow on after the main patchset is posted. I've tested it on my x86 machine. Wonder if you can test it on your ARM system to make sure it works properly there.

Will appreciate your feedback and review.

I've tested the series on our Kunpeng 920, the sysctl works as well.

One minor question is that if the user want to boot with cluster scheduler enabled, seems we have to boot with aditional sysctl.kernel.sched_cluster_enabled=1 appended in the cmdline. Then we'll build the domians without cluster scheduler first and rebuild the domains later, is this as expected? Can we provide a way to build the domains once with or without the cluster scheduling at boot time, like kernel parameters? just some trivial thoughts. :)

Good suggestion. I'll add a kernel parameter for that.

...

Thanks, Yicong

...
Tim

Tim Chen (3): sched: Create SDTL_SKIP flag to skip topology level sched: Add SD_CLUSTER topology flag to cluster sched domain sched: Add runtime knob sysctl_sched_cluster_enabled

arch/x86/kernel/smpboot.c | 8 +++++ drivers/base/arch_topology.c | 7 ++++ include/linux/sched/sd_flags.h | 7 ++++ include/linux/sched/sysctl.h | 6 ++++ include/linux/sched/topology.h | 3 +- include/linux/topology.h | 7 ++++ kernel/sched/core.c | 1 + kernel/sched/sched.h | 6 ++++ kernel/sched/topology.c | 58 +++++++++++++++++++++++++++++++++- kernel/sysctl.c | 11 +++++++ 10 files changed, 112 insertions(+), 2 deletions(-)

1442

days inactive

1443

days old

linaro-open-discussions@op-lists.linaro.org

7 comments

participants

tags (0)

participants (2)

Tim Chen
Yicong Yang