diff mbox

[dpdk-dev] net/mlx5: add prefetching Rx completion queue

Message ID	20170117020940.37453-1-yskoh@mellanox.com (mailing list archive)
State	Accepted, archived
Delegated to:	Ferruh Yigit
Headers	From: Yongseok Koh <yskoh@mellanox.com> To: <ferruh.yigit@intel.com> CC: <dev@dpdk.org>, <adrien.mazarguil@6wind.com>, Yongseok Koh <yskoh@mellanox.com> Date: Mon, 16 Jan 2017 18:09:40 -0800 Message-ID: <20170117020940.37453-1-yskoh@mellanox.com> MIME-Version: 1.0 Content-Type: text/plain Received-SPF: None (protection.outlook.com: mellanox.com does not designate permitted sender hosts) X-Microsoft-Exchange-Diagnostics: =?us-ascii?Q?1; HE1PR0501MB2457; 23:Ai4hrwUq80lI8rfVMSX5HFYYxgAMPlgbIFUDLzq?= Ujo13cSZV6Rd/y9BdaYydcgMAMHoyWfbOI6Ll2JoU3OgAaSAyR/ZxvlgMrsvSW7IGLt1GC6uOS/5FeKcPQhUXTFQGlohlOxLUlqahIgL2o9soAug8oA4QQ8JJ5TlNFEyAaTXHP4SLLj4+tSZz1zPHPk6DqSGqsA8nZaYHrKJSioX4ZXOlrFF5Pi0v8FIqVepuXqbvyHg+fYKDPlV6MWYP1EpwNPMch6DFzvbpgkUcuOIELD6dmJaL2//fcRcHkoeqgxqFNQSr6Zh784wjYafYkzFqkzOt/ZSy5qSqZkiqP63eiy0Q1NqRCSM0lbB5khJkX9Ksrw09L1JtTvSNrhUv8p6T83Ni7aigQeL3+bN/AajB0ViI/MjrvwO/z4k45Raakb4I4oFk8iz2kDvwu3iw6Tqu9c4oNgjtNFHzjl9D6UWQWflIrTo+ypfHYblrgKbcrBXw2QDmyZAwVr6ecGXe026ZmxAAx80jEQH9Hz2ZUQv0wKt4N3ZfMCLhRy22MmzKxLLckbiLmGJR9sDlwzZxhYNhBAqGVV0y46HUuTwjMrRALKG2lQ4m/jsyt8KnIcZJN0Hwj/9Fx89qGE0Zevkni0+y/GqQhjayzNQMOVBNY7VJJEOain0YbSMIpXkjbx2MdFVZKbBaGmTdF7mJqDbPp9dyNL9+OuAnpBZchQqZyYy1vqNKRqZg4kksITl+HwtqE0NWB6ZXUxx6jYC4fkDB0xw4apupOaJ+ZD54edZVddxg7LIeLh3/BOxQ3zyIDsKj7Wy9HwnOfeXSR6yNLjIyMxvRCqS/aTFz7xpUbKq4AkSWc5WdsYPjEI5J6jOeB2IMVwJRUoCP0dL2+yfwKP15/wP0NYbe1yuq0WpOvvpifYbZMQVTcG/ha/xfeRQ9wRmul5a827EvXT+ilTpIgefPclXRhC5dWqtMUsfH4cFedPde+MLaOpx7PKCeOlvWhDRKqOJjq5IZzkt/sIaSxfcpT/XXZYR8hcG7n2vcxJY2qc3nWj1Tp58LT9d46Xdr5uEblkzj5eZGi6LcLRYnTCxuTgNbJg057CXvLBWrfiZfc8q7GDsmXlUvZ4V01lxMlRUffNqUh9pbQEFR+MjaKBafRhwEmHrvjLa7Dmm7dbaCR0ZSBsAhTBI4VGAd6FnAyJoktaZkECcf3KEkXeTSt5FUaau9g37rbdvRJVxy/o/SwWnEo+8EWfJO65eElqI6dQ9KEfBxlKiAP6hYBv4OYreCEIted1vBmclFVSeTprdgRB+ecQ== X-Microsoft-Exchange-Diagnostics: 1; HE1PR0501MB2457; 6:rvaaVXY4E5Q5qQM6sLg2tBv38iYNlUGMOqiX4aNGqELDje8HSeeXZjXfjws8MDlo4a9otLFUB/Tj64dVGO+Dgickh175A/sM0d8RhnMolJOBhd+BysUCrWpQ4UFD8wX4ThWCwdbIKLi0eI0Rj5Z7QUmulOR4ucVNmjn0tYuevV3UwfNHfN96p68JOiKQe9IKxCyXDTAqjYGXL0TLqB8czaggjMXuabI6OJj47OltJv1Fg+VnKXShWXpoSVGxJQfa0NRKue3RriEeWVhG494HWsdHUgAFpkmAtrQF874Tz7CQtFWLU/ikc44SJDLYAYjnM9WgF8q/CPyWHqI08kLbZA7NwKBfiPHAa8dhu7KQwNqaFvxwCuhqN+raz8lVRRNQ2BMaC4qGgU8KB0LQBCv9R70CP5TD7RvMqZDnXHeOhdkAm9BkuHQFy6oc+2iezb22R/9BQU3EbNn5kbiBw9Hvbw==; 5:41UHVN4X58hvcxQqZQ8NbWNx/Ui6CM3/vhEydNKf92O9I5Wc5jlFfkSKpUmUZEdNCBfK96STC4bWthEwNfCC+Y0O0AhTnrONecWcxTG3VFUGYGy7dr0PRNvy2n9GmQ0GLnJKCV47lNImIzfgYq4RyQY9soKBzxPpYTL3Nn2l1SE=; 24:7q4Nc8EJ3Qaw1u/MFWOcvXHJQfs3/4JyV0GZdvuDBKTsOuQas2jtr+1ZMLy6miUjuCdMx7jYoU7b0Aioceh2MjRHQN0mpnOaIjNpjwkYCOQ= SpamDiagnosticOutput: 1:99 SpamDiagnosticMetadata: NSPM X-Microsoft-Exchange-Diagnostics: 1; HE1PR0501MB2457; 7:Bi6wBk35ozzQgycN62IyDpk9A/wItf2RsQ04DHjPhZXF6Ohz/TLRfsIbnDDJotfyvjAW+OOAAltGB61oBDAOxhgir0/8XUSjLyu343zfMZ+/mOI7kiUdddWJe17SRrDtvuf/sh0yJlVimYUSsVAjwH+K106oadjb5BkKr5ice2eFR1PD1c5o0l27LCv+Usbusg9id8OxnPlfOP8cCNXGtHV99kavMu460qX3k4bWSql9II4oLV4ZmNE6OqXNsjja83GVTX6tgm616D24kKERRIILumehPwa2C1Q5A/IlspY4b927+yrmhODqx1J2wN5hD6p4h/skWg3LOuVNsRgqLLOIrnlyf0srYe4VukSCdYXHSUfttu8c26wII8T3iFM+b1eLwQJoYo6s+Y5hT9CQzcDtJdDihqiGlg3aFhy/njPjHFQ62sKHTDZMGsaoIlSeMpqX0lWZw44UU/vkiXaXAw== Subject: [dpdk-dev] [PATCH] net/mlx5: add prefetching Rx completion queue Precedence: list Errors-To: dev-bounces@dpdk.org Sender: "dev" <dev-bounces@dpdk.org>

Checks

Context	Check	Description
ci/checkpatch	success	coding style OK
ci/Intel compilation	fail	Compilation issues

Commit Message

Yongseok Koh Jan. 17, 2017, 2:09 a.m. UTC

  On receiving a compressed session of Rx completion, prefetch every entries
to be invalidated. Also, invalidate consumed completions per every 8
mini-completions, not to wait until the last entry is consumed. This helps
to reduce jitter in rx_burst.

Signed-off-by: Yongseok Koh <yskoh@mellanox.com>
---
 drivers/net/mlx5/mlx5_rxtx.c | 23 ++++++++++++++++++++---
 1 file changed, 20 insertions(+), 3 deletions(-)

Comments

Adrien Mazarguil Jan. 20, 2017, 4:56 p.m. UTC | #1

On Mon, Jan 16, 2017 at 06:09:40PM -0800, Yongseok Koh wrote:
> On receiving a compressed session of Rx completion, prefetch every entries
> to be invalidated. Also, invalidate consumed completions per every 8
> mini-completions, not to wait until the last entry is consumed. This helps
> to reduce jitter in rx_burst.
> 
> Signed-off-by: Yongseok Koh <yskoh@mellanox.com>
> ---
>  drivers/net/mlx5/mlx5_rxtx.c | 23 ++++++++++++++++++++---
>  1 file changed, 20 insertions(+), 3 deletions(-)

Acked-by: Adrien Mazarguil <adrien.mazarguil@6wind.com>

Ferruh Yigit Jan. 20, 2017, 6:42 p.m. UTC | #2

On 1/20/2017 4:56 PM, Adrien Mazarguil wrote:
> On Mon, Jan 16, 2017 at 06:09:40PM -0800, Yongseok Koh wrote:
>> On receiving a compressed session of Rx completion, prefetch every entries
>> to be invalidated. Also, invalidate consumed completions per every 8
>> mini-completions, not to wait until the last entry is consumed. This helps
>> to reduce jitter in rx_burst.
>>
>> Signed-off-by: Yongseok Koh <yskoh@mellanox.com>
>> ---
>>  drivers/net/mlx5/mlx5_rxtx.c | 23 ++++++++++++++++++++---
>>  1 file changed, 20 insertions(+), 3 deletions(-)
> 
> Acked-by: Adrien Mazarguil <adrien.mazarguil@6wind.com>

Applied to dpdk-next-net/master, thanks.

diff mbox

Patch

diff --git a/drivers/net/mlx5/mlx5_rxtx.c b/drivers/net/mlx5/mlx5_rxtx.c
index 94157202c..2ae949295 100644
--- a/drivers/net/mlx5/mlx5_rxtx.c
+++ b/drivers/net/mlx5/mlx5_rxtx.c
@@ -1156,6 +1156,7 @@  mlx5_rx_poll_len(struct rxq *rxq, volatile struct mlx5_cqe *cqe,
 	struct rxq_zip *zip = &rxq->zip;
 	uint16_t cqe_n = cqe_cnt + 1;
 	int len = 0;
+	uint16_t idx, end;
 
 	/* Process compressed data in the CQE and mini arrays. */
 	if (zip->ai) {
@@ -1166,6 +1167,14 @@  mlx5_rx_poll_len(struct rxq *rxq, volatile struct mlx5_cqe *cqe,
 		len = ntohl((*mc)[zip->ai & 7].byte_cnt);
 		*rss_hash = ntohl((*mc)[zip->ai & 7].rx_hash_result);
 		if ((++zip->ai & 7) == 0) {
+			/* Invalidate consumed CQEs */
+			idx = zip->ca;
+			end = zip->na;
+			while (idx != end) {
+				(*rxq->cqes)[idx & cqe_cnt].op_own =
+					MLX5_CQE_INVALIDATE;
+				++idx;
+			}
 			/*
 			 * Increment consumer index to skip the number of
 			 * CQEs consumed. Hardware leaves holes in the CQ
@@ -1175,8 +1184,9 @@  mlx5_rx_poll_len(struct rxq *rxq, volatile struct mlx5_cqe *cqe,
 			zip->na += 8;
 		}
 		if (unlikely(rxq->zip.ai == rxq->zip.cqe_cnt)) {
-			uint16_t idx = rxq->cq_ci + 1;
-			uint16_t end = zip->cq_ci;
+			/* Invalidate the rest */
+			idx = zip->ca;
+			end = zip->cq_ci;
 
 			while (idx != end) {
 				(*rxq->cqes)[idx & cqe_cnt].op_own =
@@ -1212,7 +1222,7 @@  mlx5_rx_poll_len(struct rxq *rxq, volatile struct mlx5_cqe *cqe,
 			 * special case the second one is located 7 CQEs after
 			 * the initial CQE instead of 8 for subsequent ones.
 			 */
-			zip->ca = rxq->cq_ci & cqe_cnt;
+			zip->ca = rxq->cq_ci;
 			zip->na = zip->ca + 7;
 			/* Compute the next non compressed CQE. */
 			--rxq->cq_ci;
@@ -1221,6 +1231,13 @@  mlx5_rx_poll_len(struct rxq *rxq, volatile struct mlx5_cqe *cqe,
 			len = ntohl((*mc)[0].byte_cnt);
 			*rss_hash = ntohl((*mc)[0].rx_hash_result);
 			zip->ai = 1;
+			/* Prefetch all the entries to be invalidated */
+			idx = zip->ca;
+			end = zip->cq_ci;
+			while (idx != end) {
+				rte_prefetch0(&(*rxq->cqes)[(idx) & cqe_cnt]);
+				++idx;
+			}
 		} else {
 			len = ntohl(cqe->byte_cnt);
 			*rss_hash = ntohl(cqe->rx_hash_res);