[net-next-2.6.git] / arch / powerpc / kernel / perf_event_fsl_emb.c

/*
 * Performance event support - Freescale Embedded Performance Monitor
 *
 * Copyright 2008-2009 Paul Mackerras, IBM Corporation.
 * Copyright 2010 Freescale Semiconductor, Inc.
 *
 * This program is free software; you can redistribute it and/or
 * modify it under the terms of the GNU General Public License
 * as published by the Free Software Foundation; either version
 * 2 of the License, or (at your option) any later version.
 */
#include <linux/kernel.h>
#include <linux/sched.h>
#include <linux/perf_event.h>
#include <linux/percpu.h>
#include <linux/hardirq.h>
#include <asm/reg_fsl_emb.h>
#include <asm/pmc.h>
#include <asm/machdep.h>
#include <asm/firmware.h>
#include <asm/ptrace.h>

struct cpu_hw_events {
	int n_events;
	int disabled;
	u8  pmcs_enabled;
	struct perf_event *event[MAX_HWEVENTS];
};
static DEFINE_PER_CPU(struct cpu_hw_events, cpu_hw_events);

static struct fsl_emb_pmu *ppmu;

/* Number of perf_events counting hardware events */
static atomic_t num_events;
/* Used to avoid races in calling reserve/release_pmc_hardware */
static DEFINE_MUTEX(pmc_reserve_mutex);

/*
 * If interrupts were soft-disabled when a PMU interrupt occurs, treat
 * it as an NMI.
 */
static inline int perf_intr_is_nmi(struct pt_regs *regs)
{
#ifdef __powerpc64__
	return !regs->softe;
#else
	return 0;
#endif
}

static void perf_event_interrupt(struct pt_regs *regs);

/*
 * Read one performance monitor counter (PMC).
 */
static unsigned long read_pmc(int idx)
{
	unsigned long val;

	switch (idx) {
	case 0:
		val = mfpmr(PMRN_PMC0);
		break;
	case 1:
		val = mfpmr(PMRN_PMC1);
		break;
	case 2:
		val = mfpmr(PMRN_PMC2);
		break;
	case 3:
		val = mfpmr(PMRN_PMC3);
		break;
	default:
		printk(KERN_ERR "oops trying to read PMC%d\n", idx);
		val = 0;
	}
	return val;
}

/*
 * Write one PMC.
 */
static void write_pmc(int idx, unsigned long val)
{
	switch (idx) {
	case 0:
		mtpmr(PMRN_PMC0, val);
		break;
	case 1:
		mtpmr(PMRN_PMC1, val);
		break;
	case 2:
		mtpmr(PMRN_PMC2, val);
		break;
	case 3:
		mtpmr(PMRN_PMC3, val);
		break;
	default:
		printk(KERN_ERR "oops trying to write PMC%d\n", idx);
	}

	isync();
}

/*
 * Write one local control A register
 */
static void write_pmlca(int idx, unsigned long val)
{
	switch (idx) {
	case 0:
		mtpmr(PMRN_PMLCA0, val);
		break;
	case 1:
		mtpmr(PMRN_PMLCA1, val);
		break;
	case 2:
		mtpmr(PMRN_PMLCA2, val);
		break;
	case 3:
		mtpmr(PMRN_PMLCA3, val);
		break;
	default:
		printk(KERN_ERR "oops trying to write PMLCA%d\n", idx);
	}

	isync();
}

/*
 * Write one local control B register
 */
static void write_pmlcb(int idx, unsigned long val)
{
	switch (idx) {
	case 0:
		mtpmr(PMRN_PMLCB0, val);
		break;
	case 1:
		mtpmr(PMRN_PMLCB1, val);
		break;
	case 2:
		mtpmr(PMRN_PMLCB2, val);
		break;
	case 3:
		mtpmr(PMRN_PMLCB3, val);
		break;
	default:
		printk(KERN_ERR "oops trying to write PMLCB%d\n", idx);
	}

	isync();
}

static void fsl_emb_pmu_read(struct perf_event *event)
{
	s64 val, delta, prev;

	/*
	 * Performance monitor interrupts come even when interrupts
	 * are soft-disabled, as long as interrupts are hard-enabled.
	 * Therefore we treat them like NMIs.
	 */
	do {
		prev = atomic64_read(&event->hw.prev_count);
		barrier();
		val = read_pmc(event->hw.idx);
	} while (atomic64_cmpxchg(&event->hw.prev_count, prev, val) != prev);

	/* The counters are only 32 bits wide */
	delta = (val - prev) & 0xfffffffful;
	atomic64_add(delta, &event->count);
	atomic64_sub(delta, &event->hw.period_left);
}

/*
 * Disable all events to prevent PMU interrupts and to allow
 * events to be added or removed.
 */
void hw_perf_disable(void)
{
	struct cpu_hw_events *cpuhw;
	unsigned long flags;

	local_irq_save(flags);
	cpuhw = &__get_cpu_var(cpu_hw_events);

	if (!cpuhw->disabled) {
		cpuhw->disabled = 1;

		/*
		 * Check if we ever enabled the PMU on this cpu.
		 */
		if (!cpuhw->pmcs_enabled) {
			ppc_enable_pmcs();
			cpuhw->pmcs_enabled = 1;
		}

		if (atomic_read(&num_events)) {
			/*
			 * Set the 'freeze all counters' bit, and disable
			 * interrupts.  The barrier is to make sure the
			 * mtpmr has been executed and the PMU has frozen
			 * the events before we return.
			 */

			mtpmr(PMRN_PMGC0, PMGC0_FAC);
			isync();
		}
	}
	local_irq_restore(flags);
}

/*
 * Re-enable all events if disable == 0.
 * If we were previously disabled and events were added, then
 * put the new config on the PMU.
 */
void hw_perf_enable(void)
{
	struct cpu_hw_events *cpuhw;
	unsigned long flags;

	local_irq_save(flags);
	cpuhw = &__get_cpu_var(cpu_hw_events);
	if (!cpuhw->disabled)
		goto out;

	cpuhw->disabled = 0;
	ppc_set_pmu_inuse(cpuhw->n_events != 0);

	if (cpuhw->n_events > 0) {
		mtpmr(PMRN_PMGC0, PMGC0_PMIE | PMGC0_FCECE);
		isync();
	}

 out:
	local_irq_restore(flags);
}

static int collect_events(struct perf_event *group, int max_count,
			  struct perf_event *ctrs[])
{
	int n = 0;
	struct perf_event *event;

	if (!is_software_event(group)) {
		if (n >= max_count)
			return -1;
		ctrs[n] = group;
		n++;
	}
	list_for_each_entry(event, &group->sibling_list, group_entry) {
		if (!is_software_event(event) &&
		    event->state != PERF_EVENT_STATE_OFF) {
			if (n >= max_count)
				return -1;
			ctrs[n] = event;
			n++;
		}
	}
	return n;
}

/* perf must be disabled, context locked on entry */
static int fsl_emb_pmu_enable(struct perf_event *event)
{
	struct cpu_hw_events *cpuhw;
	int ret = -EAGAIN;
	int num_counters = ppmu->n_counter;
	u64 val;
	int i;

	cpuhw = &get_cpu_var(cpu_hw_events);

	if (event->hw.config & FSL_EMB_EVENT_RESTRICTED)
		num_counters = ppmu->n_restricted;

	/*
	 * Allocate counters from top-down, so that restricted-capable
	 * counters are kept free as long as possible.
	 */
	for (i = num_counters - 1; i >= 0; i--) {
		if (cpuhw->event[i])
			continue;

		break;
	}

	if (i < 0)
		goto out;

	event->hw.idx = i;
	cpuhw->event[i] = event;
	++cpuhw->n_events;

	val = 0;
	if (event->hw.sample_period) {
		s64 left = atomic64_read(&event->hw.period_left);
		if (left < 0x80000000L)
			val = 0x80000000L - left;
	}
	atomic64_set(&event->hw.prev_count, val);
	write_pmc(i, val);
	perf_event_update_userpage(event);

	write_pmlcb(i, event->hw.config >> 32);
	write_pmlca(i, event->hw.config_base);

	ret = 0;
 out:
	put_cpu_var(cpu_hw_events);
	return ret;
}

/* perf must be disabled, context locked on entry */
static void fsl_emb_pmu_disable(struct perf_event *event)
{
	struct cpu_hw_events *cpuhw;
	int i = event->hw.idx;

	if (i < 0)
		goto out;

	fsl_emb_pmu_read(event);

	cpuhw = &get_cpu_var(cpu_hw_events);

	WARN_ON(event != cpuhw->event[event->hw.idx]);

	write_pmlca(i, 0);
	write_pmlcb(i, 0);
	write_pmc(i, 0);

	cpuhw->event[i] = NULL;
	event->hw.idx = -1;

	/*
	 * TODO: if at least one restricted event exists, and we
	 * just freed up a non-restricted-capable counter, and
	 * there is a restricted-capable counter occupied by
	 * a non-restricted event, migrate that event to the
	 * vacated counter.
	 */

	cpuhw->n_events--;

 out:
	put_cpu_var(cpu_hw_events);
}

/*
 * Re-enable interrupts on a event after they were throttled
 * because they were coming too fast.
 *
 * Context is locked on entry, but perf is not disabled.
 */
static void fsl_emb_pmu_unthrottle(struct perf_event *event)
{
	s64 val, left;
	unsigned long flags;

	if (event->hw.idx < 0 || !event->hw.sample_period)
		return;
	local_irq_save(flags);
	perf_disable();
	fsl_emb_pmu_read(event);
	left = event->hw.sample_period;
	event->hw.last_period = left;
	val = 0;
	if (left < 0x80000000L)
		val = 0x80000000L - left;
	write_pmc(event->hw.idx, val);
	atomic64_set(&event->hw.prev_count, val);
	atomic64_set(&event->hw.period_left, left);
	perf_event_update_userpage(event);
	perf_enable();
	local_irq_restore(flags);
}

static struct pmu fsl_emb_pmu = {
	.enable		= fsl_emb_pmu_enable,
	.disable	= fsl_emb_pmu_disable,
	.read		= fsl_emb_pmu_read,
	.unthrottle	= fsl_emb_pmu_unthrottle,
};

/*
 * Release the PMU if this is the last perf_event.
 */
static void hw_perf_event_destroy(struct perf_event *event)
{
	if (!atomic_add_unless(&num_events, -1, 1)) {
		mutex_lock(&pmc_reserve_mutex);
		if (atomic_dec_return(&num_events) == 0)
			release_pmc_hardware();
		mutex_unlock(&pmc_reserve_mutex);
	}
}

/*
 * Translate a generic cache event_id config to a raw event_id code.
 */
static int hw_perf_cache_event(u64 config, u64 *eventp)
{
	unsigned long type, op, result;
	int ev;

	if (!ppmu->cache_events)
		return -EINVAL;

	/* unpack config */
	type = config & 0xff;
	op = (config >> 8) & 0xff;
	result = (config >> 16) & 0xff;

	if (type >= PERF_COUNT_HW_CACHE_MAX ||
	    op >= PERF_COUNT_HW_CACHE_OP_MAX ||
	    result >= PERF_COUNT_HW_CACHE_RESULT_MAX)
		return -EINVAL;

	ev = (*ppmu->cache_events)[type][op][result];
	if (ev == 0)
		return -EOPNOTSUPP;
	if (ev == -1)
		return -EINVAL;
	*eventp = ev;
	return 0;
}

const struct pmu *hw_perf_event_init(struct perf_event *event)
{
	u64 ev;
	struct perf_event *events[MAX_HWEVENTS];
	int n;
	int err;
	int num_restricted;
	int i;

	switch (event->attr.type) {
	case PERF_TYPE_HARDWARE:
		ev = event->attr.config;
		if (ev >= ppmu->n_generic || ppmu->generic_events[ev] == 0)
			return ERR_PTR(-EOPNOTSUPP);
		ev = ppmu->generic_events[ev];
		break;

	case PERF_TYPE_HW_CACHE:
		err = hw_perf_cache_event(event->attr.config, &ev);
		if (err)
			return ERR_PTR(err);
		break;

	case PERF_TYPE_RAW:
		ev = event->attr.config;
		break;

	default:
		return ERR_PTR(-EINVAL);
	}

	event->hw.config = ppmu->xlate_event(ev);
	if (!(event->hw.config & FSL_EMB_EVENT_VALID))
		return ERR_PTR(-EINVAL);

	/*
	 * If this is in a group, check if it can go on with all the
	 * other hardware events in the group.  We assume the event
	 * hasn't been linked into its leader's sibling list at this point.
	 */
	n = 0;
	if (event->group_leader != event) {
		n = collect_events(event->group_leader,
		                   ppmu->n_counter - 1, events);
		if (n < 0)
			return ERR_PTR(-EINVAL);
	}

	if (event->hw.config & FSL_EMB_EVENT_RESTRICTED) {
		num_restricted = 0;
		for (i = 0; i < n; i++) {
			if (events[i]->hw.config & FSL_EMB_EVENT_RESTRICTED)
				num_restricted++;
		}

		if (num_restricted >= ppmu->n_restricted)
			return ERR_PTR(-EINVAL);
	}

	event->hw.idx = -1;

	event->hw.config_base = PMLCA_CE | PMLCA_FCM1 |
	                        (u32)((ev << 16) & PMLCA_EVENT_MASK);

	if (event->attr.exclude_user)
		event->hw.config_base |= PMLCA_FCU;
	if (event->attr.exclude_kernel)
		event->hw.config_base |= PMLCA_FCS;
	if (event->attr.exclude_idle)
		return ERR_PTR(-ENOTSUPP);

	event->hw.last_period = event->hw.sample_period;
	atomic64_set(&event->hw.period_left, event->hw.last_period);

	/*
	 * See if we need to reserve the PMU.
	 * If no events are currently in use, then we have to take a
	 * mutex to ensure that we don't race with another task doing
	 * reserve_pmc_hardware or release_pmc_hardware.
	 */
	err = 0;
	if (!atomic_inc_not_zero(&num_events)) {
		mutex_lock(&pmc_reserve_mutex);
		if (atomic_read(&num_events) == 0 &&
		    reserve_pmc_hardware(perf_event_interrupt))
			err = -EBUSY;
		else
			atomic_inc(&num_events);
		mutex_unlock(&pmc_reserve_mutex);

		mtpmr(PMRN_PMGC0, PMGC0_FAC);
		isync();
	}
	event->destroy = hw_perf_event_destroy;

	if (err)
		return ERR_PTR(err);
	return &fsl_emb_pmu;
}

/*
 * A counter has overflowed; update its count and record
 * things if requested.  Note that interrupts are hard-disabled
 * here so there is no possibility of being interrupted.
 */
static void record_and_restart(struct perf_event *event, unsigned long val,
			       struct pt_regs *regs, int nmi)
{
	u64 period = event->hw.sample_period;
	s64 prev, delta, left;
	int record = 0;

	/* we don't have to worry about interrupts here */
	prev = atomic64_read(&event->hw.prev_count);
	delta = (val - prev) & 0xfffffffful;
	atomic64_add(delta, &event->count);

	/*
	 * See if the total period for this event has expired,
	 * and update for the next period.
	 */
	val = 0;
	left = atomic64_read(&event->hw.period_left) - delta;
	if (period) {
		if (left <= 0) {
			left += period;
			if (left <= 0)
				left = period;
			record = 1;
		}
		if (left < 0x80000000LL)
			val = 0x80000000LL - left;
	}

	/*
	 * Finally record data if requested.
	 */
	if (record) {
		struct perf_sample_data data;

		perf_sample_data_init(&data, 0);

		if (perf_event_overflow(event, nmi, &data, regs)) {
			/*
			 * Interrupts are coming too fast - throttle them
			 * by setting the event to 0, so it will be
			 * at least 2^30 cycles until the next interrupt
			 * (assuming each event counts at most 2 counts
			 * per cycle).
			 */
			val = 0;
			left = ~0ULL >> 1;
		}
	}

	write_pmc(event->hw.idx, val);
	atomic64_set(&event->hw.prev_count, val);
	atomic64_set(&event->hw.period_left, left);
	perf_event_update_userpage(event);
}

static void perf_event_interrupt(struct pt_regs *regs)
{
	int i;
	struct cpu_hw_events *cpuhw = &__get_cpu_var(cpu_hw_events);
	struct perf_event *event;
	unsigned long val;
	int found = 0;
	int nmi;

	nmi = perf_intr_is_nmi(regs);
	if (nmi)
		nmi_enter();
	else
		irq_enter();

	for (i = 0; i < ppmu->n_counter; ++i) {
		event = cpuhw->event[i];

		val = read_pmc(i);
		if ((int)val < 0) {
			if (event) {
				/* event has overflowed */
				found = 1;
				record_and_restart(event, val, regs, nmi);
			} else {
				/*
				 * Disabled counter is negative,
				 * reset it just in case.
				 */
				write_pmc(i, 0);
			}
		}
	}

	/* PMM will keep counters frozen until we return from the interrupt. */
	mtmsr(mfmsr() | MSR_PMM);
	mtpmr(PMRN_PMGC0, PMGC0_PMIE | PMGC0_FCECE);
	isync();

	if (nmi)
		nmi_exit();
	else
		irq_exit();
}

void hw_perf_event_setup(int cpu)
{
	struct cpu_hw_events *cpuhw = &per_cpu(cpu_hw_events, cpu);

	memset(cpuhw, 0, sizeof(*cpuhw));
}

int register_fsl_emb_pmu(struct fsl_emb_pmu *pmu)
{
	if (ppmu)
		return -EBUSY;		/* something's already registered */

	ppmu = pmu;
	pr_info("%s performance monitor hardware support registered\n",
		pmu->name);

	return 0;
}
Commit	Line	Data
a1110654 SW	1	/*
	2	* Performance event support - Freescale Embedded Performance Monitor
	3	*
	4	* Copyright 2008-2009 Paul Mackerras, IBM Corporation.
	5	* Copyright 2010 Freescale Semiconductor, Inc.
	6	*
	7	* This program is free software; you can redistribute it and/or
	8	* modify it under the terms of the GNU General Public License
	9	* as published by the Free Software Foundation; either version
	10	* 2 of the License, or (at your option) any later version.
	11	*/
	12	#include <linux/kernel.h>
	13	#include <linux/sched.h>
	14	#include <linux/perf_event.h>
	15	#include <linux/percpu.h>
	16	#include <linux/hardirq.h>
	17	#include <asm/reg_fsl_emb.h>
	18	#include <asm/pmc.h>
	19	#include <asm/machdep.h>
	20	#include <asm/firmware.h>
	21	#include <asm/ptrace.h>
	22
	23	struct cpu_hw_events {
	24	int n_events;
	25	int disabled;
	26	u8 pmcs_enabled;
	27	struct perf_event *event[MAX_HWEVENTS];
	28	};
	29	static DEFINE_PER_CPU(struct cpu_hw_events, cpu_hw_events);
	30
	31	static struct fsl_emb_pmu *ppmu;
	32
	33	/* Number of perf_events counting hardware events */
	34	static atomic_t num_events;
	35	/* Used to avoid races in calling reserve/release_pmc_hardware */
	36	static DEFINE_MUTEX(pmc_reserve_mutex);
	37
	38	/*
	39	* If interrupts were soft-disabled when a PMU interrupt occurs, treat
	40	* it as an NMI.
	41	*/
	42	static inline int perf_intr_is_nmi(struct pt_regs *regs)
	43	{
	44	#ifdef __powerpc64__
	45	return !regs->softe;
	46	#else
	47	return 0;
	48	#endif
	49	}
	50
	51	static void perf_event_interrupt(struct pt_regs *regs);
	52
	53	/*
	54	* Read one performance monitor counter (PMC).
	55	*/
	56	static unsigned long read_pmc(int idx)
	57	{
	58	unsigned long val;
	59
	60	switch (idx) {
	61	case 0:
	62	val = mfpmr(PMRN_PMC0);
	63	break;
	64	case 1:
65	val = mfpmr(PMRN_PMC1);
66	break;
67	case 2:
68	val = mfpmr(PMRN_PMC2);
69	break;
70	case 3:
71	val = mfpmr(PMRN_PMC3);
72	break;
73	default:
74	printk(KERN_ERR "oops trying to read PMC%d\n", idx);
75	val = 0;
76	}
77	return val;
78	}
79
80	/*
81	* Write one PMC.
82	*/
83	static void write_pmc(int idx, unsigned long val)
84	{
85	switch (idx) {
86	case 0:
87	mtpmr(PMRN_PMC0, val);
88	break;
89	case 1:
90	mtpmr(PMRN_PMC1, val);
91	break;
92	case 2:
93	mtpmr(PMRN_PMC2, val);
94	break;
95	case 3:
96	mtpmr(PMRN_PMC3, val);
97	break;
98	default:
99	printk(KERN_ERR "oops trying to write PMC%d\n", idx);
100	}
101
102	isync();
103	}
104
105	/*
106	* Write one local control A register
107	*/
108	static void write_pmlca(int idx, unsigned long val)
109	{
110	switch (idx) {
111	case 0:
112	mtpmr(PMRN_PMLCA0, val);
113	break;
114	case 1:
115	mtpmr(PMRN_PMLCA1, val);
116	break;
117	case 2:
118	mtpmr(PMRN_PMLCA2, val);
119	break;
120	case 3:
121	mtpmr(PMRN_PMLCA3, val);
122	break;
123	default:
124	printk(KERN_ERR "oops trying to write PMLCA%d\n", idx);
125	}
126
127	isync();
128	}
129
130	/*
131	* Write one local control B register
132	*/
133	static void write_pmlcb(int idx, unsigned long val)
134	{
135	switch (idx) {
136	case 0:
137	mtpmr(PMRN_PMLCB0, val);
138	break;
139	case 1:
140	mtpmr(PMRN_PMLCB1, val);
141	break;
142	case 2:
143	mtpmr(PMRN_PMLCB2, val);
144	break;
145	case 3:
146	mtpmr(PMRN_PMLCB3, val);
147	break;
148	default:
149	printk(KERN_ERR "oops trying to write PMLCB%d\n", idx);
150	}
151
152	isync();
153	}
154
155	static void fsl_emb_pmu_read(struct perf_event *event)
156	{
157	s64 val, delta, prev;
158
159	/*
160	* Performance monitor interrupts come even when interrupts
161	* are soft-disabled, as long as interrupts are hard-enabled.
162	* Therefore we treat them like NMIs.
163	*/
164	do {
165	prev = atomic64_read(&event->hw.prev_count);
166	barrier();
167	val = read_pmc(event->hw.idx);
168	} while (atomic64_cmpxchg(&event->hw.prev_count, prev, val) != prev);
169
170	/* The counters are only 32 bits wide */
171	delta = (val - prev) & 0xfffffffful;
172	atomic64_add(delta, &event->count);
173	atomic64_sub(delta, &event->hw.period_left);
174	}
175
176	/*
177	* Disable all events to prevent PMU interrupts and to allow
178	* events to be added or removed.
179	*/
180	void hw_perf_disable(void)
181	{
182	struct cpu_hw_events *cpuhw;
183	unsigned long flags;
184
185	local_irq_save(flags);
186	cpuhw = &__get_cpu_var(cpu_hw_events);
187
188	if (!cpuhw->disabled) {
189	cpuhw->disabled = 1;
190
191	/*
192	* Check if we ever enabled the PMU on this cpu.
193	*/
194	if (!cpuhw->pmcs_enabled) {
195	ppc_enable_pmcs();
196	cpuhw->pmcs_enabled = 1;
197	}
198
199	if (atomic_read(&num_events)) {
200	/*
201	* Set the 'freeze all counters' bit, and disable
202	* interrupts. The barrier is to make sure the
203	* mtpmr has been executed and the PMU has frozen
204	* the events before we return.
205	*/
206
207	mtpmr(PMRN_PMGC0, PMGC0_FAC);
208	isync();
209	}
210	}
211	local_irq_restore(flags);
212	}
213
214	/*
215	* Re-enable all events if disable == 0.
216	* If we were previously disabled and events were added, then
217	* put the new config on the PMU.
218	*/
219	void hw_perf_enable(void)
220	{
221	struct cpu_hw_events *cpuhw;
222	unsigned long flags;
223
224	local_irq_save(flags);
225	cpuhw = &__get_cpu_var(cpu_hw_events);
226	if (!cpuhw->disabled)
227	goto out;
228
229	cpuhw->disabled = 0;
230	ppc_set_pmu_inuse(cpuhw->n_events != 0);
231
232	if (cpuhw->n_events > 0) {
233	mtpmr(PMRN_PMGC0, PMGC0_PMIE \| PMGC0_FCECE);
234	isync();
235	}
236
237	out:
238	local_irq_restore(flags);
239	}
240
241	static int collect_events(struct perf_event *group, int max_count,
242	struct perf_event *ctrs[])
243	{
244	int n = 0;
245	struct perf_event *event;
246
247	if (!is_software_event(group)) {
248	if (n >= max_count)
249	return -1;
250	ctrs[n] = group;
251	n++;
252	}
253	list_for_each_entry(event, &group->sibling_list, group_entry) {
254	if (!is_software_event(event) &&
255	event->state != PERF_EVENT_STATE_OFF) {
256	if (n >= max_count)
257	return -1;
258	ctrs[n] = event;
259	n++;
260	}
261	}
262	return n;
263	}
264
265	/* perf must be disabled, context locked on entry */
266	static int fsl_emb_pmu_enable(struct perf_event *event)
267	{
268	struct cpu_hw_events *cpuhw;
269	int ret = -EAGAIN;
270	int num_counters = ppmu->n_counter;
271	u64 val;
272	int i;
273
274	cpuhw = &get_cpu_var(cpu_hw_events);
275
276	if (event->hw.config & FSL_EMB_EVENT_RESTRICTED)
277	num_counters = ppmu->n_restricted;
278
279	/*
280	* Allocate counters from top-down, so that restricted-capable
281	* counters are kept free as long as possible.
282	*/
283	for (i = num_counters - 1; i >= 0; i--) {
284	if (cpuhw->event[i])
285	continue;
286
287	break;
288	}
289
290	if (i < 0)
291	goto out;
292
293	event->hw.idx = i;
294	cpuhw->event[i] = event;
295	++cpuhw->n_events;
296
297	val = 0;
298	if (event->hw.sample_period) {
299	s64 left = atomic64_read(&event->hw.period_left);
300	if (left < 0x80000000L)
301	val = 0x80000000L - left;
302	}
303	atomic64_set(&event->hw.prev_count, val);
304	write_pmc(i, val);
305	perf_event_update_userpage(event);
306
307	write_pmlcb(i, event->hw.config >> 32);
308	write_pmlca(i, event->hw.config_base);
309
310	ret = 0;
311	out:
312	put_cpu_var(cpu_hw_events);
313	return ret;
314	}
315
316	/* perf must be disabled, context locked on entry */
317	static void fsl_emb_pmu_disable(struct perf_event *event)
318	{
319	struct cpu_hw_events *cpuhw;
320	int i = event->hw.idx;
321
322	if (i < 0)
323	goto out;
324
325	fsl_emb_pmu_read(event);
326
327	cpuhw = &get_cpu_var(cpu_hw_events);
328
329	WARN_ON(event != cpuhw->event[event->hw.idx]);
330
331	write_pmlca(i, 0);
332	write_pmlcb(i, 0);
333	write_pmc(i, 0);
334
335	cpuhw->event[i] = NULL;
336	event->hw.idx = -1;
337
338	/*
339	* TODO: if at least one restricted event exists, and we
340	* just freed up a non-restricted-capable counter, and
341	* there is a restricted-capable counter occupied by
342	* a non-restricted event, migrate that event to the
343	* vacated counter.
344	*/
345
346	cpuhw->n_events--;
347
348	out:
349	put_cpu_var(cpu_hw_events);
350	}
351
352	/*
353	* Re-enable interrupts on a event after they were throttled
354	* because they were coming too fast.
355	*
356	* Context is locked on entry, but perf is not disabled.
357	*/
358	static void fsl_emb_pmu_unthrottle(struct perf_event *event)
359	{
360	s64 val, left;
361	unsigned long flags;
362
363	if (event->hw.idx < 0 \|\| !event->hw.sample_period)
364	return;
365	local_irq_save(flags);
366	perf_disable();
367	fsl_emb_pmu_read(event);
368	left = event->hw.sample_period;
369	event->hw.last_period = left;
370	val = 0;
371	if (left < 0x80000000L)
372	val = 0x80000000L - left;
373	write_pmc(event->hw.idx, val);
374	atomic64_set(&event->hw.prev_count, val);
375	atomic64_set(&event->hw.period_left, left);
376	perf_event_update_userpage(event);
377	perf_enable();
378	local_irq_restore(flags);
379	}
380
381	static struct pmu fsl_emb_pmu = {
382	.enable = fsl_emb_pmu_enable,
383	.disable = fsl_emb_pmu_disable,
384	.read = fsl_emb_pmu_read,
385	.unthrottle = fsl_emb_pmu_unthrottle,
386	};
387
388	/*
389	* Release the PMU if this is the last perf_event.
390	*/
391	static void hw_perf_event_destroy(struct perf_event *event)
392	{
393	if (!atomic_add_unless(&num_events, -1, 1)) {
394	mutex_lock(&pmc_reserve_mutex);
395	if (atomic_dec_return(&num_events) == 0)
396	release_pmc_hardware();
397	mutex_unlock(&pmc_reserve_mutex);
398	}
399	}
400
401	/*
402	* Translate a generic cache event_id config to a raw event_id code.
403	*/
404	static int hw_perf_cache_event(u64 config, u64 *eventp)
405	{
406	unsigned long type, op, result;
407	int ev;
408
409	if (!ppmu->cache_events)
410	return -EINVAL;
411
412	/* unpack config */
413	type = config & 0xff;
414	op = (config >> 8) & 0xff;
415	result = (config >> 16) & 0xff;
416
417	if (type >= PERF_COUNT_HW_CACHE_MAX \|\|
418	op >= PERF_COUNT_HW_CACHE_OP_MAX \|\|
419	result >= PERF_COUNT_HW_CACHE_RESULT_MAX)
420	return -EINVAL;
421
422	ev = (*ppmu->cache_events)[type][op][result];
423	if (ev == 0)
424	return -EOPNOTSUPP;
425	if (ev == -1)
426	return -EINVAL;
427	*eventp = ev;
428	return 0;
429	}
430
431	const struct pmu hw_perf_event_init(struct perf_event event)
432	{
433	u64 ev;
434	struct perf_event *events[MAX_HWEVENTS];
435	int n;
436	int err;
437	int num_restricted;
438	int i;
439
440	switch (event->attr.type) {
441	case PERF_TYPE_HARDWARE:
442	ev = event->attr.config;
443	if (ev >= ppmu->n_generic \|\| ppmu->generic_events[ev] == 0)
444	return ERR_PTR(-EOPNOTSUPP);
445	ev = ppmu->generic_events[ev];
446	break;
447
448	case PERF_TYPE_HW_CACHE:
449	err = hw_perf_cache_event(event->attr.config, &ev);
450	if (err)
451	return ERR_PTR(err);
452	break;
453
454	case PERF_TYPE_RAW:
455	ev = event->attr.config;
456	break;
457
458	default:
459	return ERR_PTR(-EINVAL);
460	}
461
462	event->hw.config = ppmu->xlate_event(ev);
463	if (!(event->hw.config & FSL_EMB_EVENT_VALID))
464	return ERR_PTR(-EINVAL);
465
466	/*
467	* If this is in a group, check if it can go on with all the
468	* other hardware events in the group. We assume the event
469	* hasn't been linked into its leader's sibling list at this point.
470	*/
471	n = 0;
472	if (event->group_leader != event) {
473	n = collect_events(event->group_leader,
474	ppmu->n_counter - 1, events);
475	if (n < 0)
476	return ERR_PTR(-EINVAL);
477	}
478
479	if (event->hw.config & FSL_EMB_EVENT_RESTRICTED) {
480	num_restricted = 0;
481	for (i = 0; i < n; i++) {
482	if (events[i]->hw.config & FSL_EMB_EVENT_RESTRICTED)
483	num_restricted++;
484	}
485
486	if (num_restricted >= ppmu->n_restricted)
487	return ERR_PTR(-EINVAL);
488	}
489
490	event->hw.idx = -1;
491
492	event->hw.config_base = PMLCA_CE \| PMLCA_FCM1 \|
493	(u32)((ev << 16) & PMLCA_EVENT_MASK);
494
495	if (event->attr.exclude_user)
496	event->hw.config_base \|= PMLCA_FCU;
497	if (event->attr.exclude_kernel)
498	event->hw.config_base \|= PMLCA_FCS;
499	if (event->attr.exclude_idle)
500	return ERR_PTR(-ENOTSUPP);
501
502	event->hw.last_period = event->hw.sample_period;
503	atomic64_set(&event->hw.period_left, event->hw.last_period);
504
505	/*
506	* See if we need to reserve the PMU.
507	* If no events are currently in use, then we have to take a
508	* mutex to ensure that we don't race with another task doing
509	* reserve_pmc_hardware or release_pmc_hardware.
510	*/
511	err = 0;
512	if (!atomic_inc_not_zero(&num_events)) {
513	mutex_lock(&pmc_reserve_mutex);
514	if (atomic_read(&num_events) == 0 &&
515	reserve_pmc_hardware(perf_event_interrupt))
516	err = -EBUSY;
517	else
518	atomic_inc(&num_events);
519	mutex_unlock(&pmc_reserve_mutex);
520
521	mtpmr(PMRN_PMGC0, PMGC0_FAC);
522	isync();
523	}
524	event->destroy = hw_perf_event_destroy;
525
526	if (err)
527	return ERR_PTR(err);
528	return &fsl_emb_pmu;
529	}
530
531	/*
532	* A counter has overflowed; update its count and record
533	* things if requested. Note that interrupts are hard-disabled
534	* here so there is no possibility of being interrupted.
535	*/
536	static void record_and_restart(struct perf_event *event, unsigned long val,
537	struct pt_regs *regs, int nmi)
538	{
539	u64 period = event->hw.sample_period;
540	s64 prev, delta, left;
541	int record = 0;
542
543	/* we don't have to worry about interrupts here */
544	prev = atomic64_read(&event->hw.prev_count);
545	delta = (val - prev) & 0xfffffffful;
546	atomic64_add(delta, &event->count);
547
548	/*
549	* See if the total period for this event has expired,
550	* and update for the next period.
551	*/
552	val = 0;
553	left = atomic64_read(&event->hw.period_left) - delta;
554	if (period) {
555	if (left <= 0) {
556	left += period;
557	if (left <= 0)
558	left = period;
559	record = 1;
560	}
561	if (left < 0x80000000LL)
562	val = 0x80000000LL - left;
563	}
564
565	/*
566	* Finally record data if requested.
567	*/
568	if (record) {
6b95ed34 PZ	569	struct perf_sample_data data;
	570
	571	perf_sample_data_init(&data, 0);
a1110654 SW	572
	573	if (perf_event_overflow(event, nmi, &data, regs)) {
	574	/*
	575	* Interrupts are coming too fast - throttle them
	576	* by setting the event to 0, so it will be
	577	* at least 2^30 cycles until the next interrupt
	578	* (assuming each event counts at most 2 counts
	579	* per cycle).
	580	*/
	581	val = 0;
	582	left = ~0ULL >> 1;
	583	}
	584	}
	585
	586	write_pmc(event->hw.idx, val);
	587	atomic64_set(&event->hw.prev_count, val);
	588	atomic64_set(&event->hw.period_left, left);
	589	perf_event_update_userpage(event);
	590	}
	591
	592	static void perf_event_interrupt(struct pt_regs *regs)
	593	{
	594	int i;
	595	struct cpu_hw_events *cpuhw = &__get_cpu_var(cpu_hw_events);
	596	struct perf_event *event;
	597	unsigned long val;
	598	int found = 0;
	599	int nmi;
	600
	601	nmi = perf_intr_is_nmi(regs);
	602	if (nmi)
	603	nmi_enter();
	604	else
	605	irq_enter();
	606
	607	for (i = 0; i < ppmu->n_counter; ++i) {
	608	event = cpuhw->event[i];
	609
	610	val = read_pmc(i);
	611	if ((int)val < 0) {
	612	if (event) {
	613	/* event has overflowed */
	614	found = 1;
	615	record_and_restart(event, val, regs, nmi);
	616	} else {
	617	/*
	618	* Disabled counter is negative,
	619	* reset it just in case.
	620	*/
	621	write_pmc(i, 0);
	622	}
	623	}
	624	}
	625
	626	/* PMM will keep counters frozen until we return from the interrupt. */
	627	mtmsr(mfmsr() \| MSR_PMM);
	628	mtpmr(PMRN_PMGC0, PMGC0_PMIE \| PMGC0_FCECE);
	629	isync();
	630
	631	if (nmi)
	632	nmi_exit();
	633	else
	634	irq_exit();
	635	}
636
637	void hw_perf_event_setup(int cpu)
638	{
639	struct cpu_hw_events *cpuhw = &per_cpu(cpu_hw_events, cpu);
640
641	memset(cpuhw, 0, sizeof(*cpuhw));
642	}
643
644	int register_fsl_emb_pmu(struct fsl_emb_pmu *pmu)
645	{
646	if (ppmu)
647	return -EBUSY; /* something's already registered */
648
649	ppmu = pmu;
650	pr_info("%s performance monitor hardware support registered\n",
651	pmu->name);
652
653	return 0;
654	}