cmd/internal/obj/riscv: add support for vector fixed-point arithmetic instructions

Add support for vector fixed-point arithmetic instructions to the RISC-V assembler. This includes single width saturating addition and subtraction, averaging addition and subtraction and scaling shift instructions. Change-Id: I9aa27e9565ad016ba5bb2b479e1ba70db24e4ff5 Reviewed-on: https://go-review.googlesource.com/c/go/+/646776 Reviewed-by: Mark Ryan <markdryan@rivosinc.com> Reviewed-by: Carlos Amedee <carlos@golang.org> Reviewed-by: Dmitri Shuralyov <dmitshur@google.com> LUCI-TryBot-Result: Go LUCI <golang-scoped@luci-project-accounts.iam.gserviceaccount.com>
author: Joel Sing <joel@sing.id.au> 2025-01-06 00:30:30 +1100
committer: Joel Sing <joel@sing.id.au> 2025-04-01 05:31:22 -0700
commit: 4c1b8ca98c716f0499bb30fd141aa6d4dec7390c (patch)
tree: a60b4973fb6987a81ee9eb6318edfea079fdfb06 /src/cmd/asm
parent: 4c32b1cc753e9005ed7c741bf69d3cb69ee3a56c (diff)
download: go-4c1b8ca98c716f0499bb30fd141aa6d4dec7390c.tar.xz
3 files changed, 138 insertions, 0 deletions
diff --git a/src/cmd/asm/internal/asm/testdata/riscv64.s b/src/cmd/asm/internal/asm/testdata/riscv64.s
index 74632360e3..1bb52e997d 100644
--- a/src/cmd/asm/internal/asm/testdata/riscv64.s
+++ b/src/cmd/asm/internal/asm/testdata/riscv64.s
@@ -863,6 +863,80 @@ start:
 	VMVVX		X10, V3				// d741055e
 	VMVVI		$15, V3				// d7b1075e
 
+	// 31.12.1: Vector Single-Width Saturating Add and Subtract
+	VSADDUVV	V1, V2, V3			// d7812082
+	VSADDUVV	V1, V2, V0, V3			// d7812080
+	VSADDUVX	X10, V2, V3			// d7412582
+	VSADDUVX	X10, V2, V0, V3			// d7412580
+	VSADDUVI	$15, V2, V3			// d7b12782
+	VSADDUVI	$15, V2, V0, V3			// d7b12780
+	VSADDVV		V1, V2, V3			// d7812086
+	VSADDVV		V1, V2, V0, V3			// d7812084
+	VSADDVX		X10, V2, V3			// d7412586
+	VSADDVX		X10, V2, V0, V3			// d7412584
+	VSADDVI		$15, V2, V3			// d7b12786
+	VSADDVI		$15, V2, V0, V3			// d7b12784
+	VSSUBUVV	V1, V2, V3			// d781208a
+	VSSUBUVV	V1, V2, V0, V3			// d7812088
+	VSSUBUVX	X10, V2, V3			// d741258a
+	VSSUBUVX	X10, V2, V0, V3			// d7412588
+	VSSUBVV		V1, V2, V3			// d781208e
+	VSSUBVV		V1, V2, V0, V3			// d781208c
+	VSSUBVX		X10, V2, V3			// d741258e
+	VSSUBVX		X10, V2, V0, V3			// d741258c
+
+	// 31.12.2: Vector Single-Width Averaging Add and Subtract
+	VAADDUVV	V1, V2, V3			// d7a12022
+	VAADDUVV	V1, V2, V0, V3			// d7a12020
+	VAADDUVX	X10, V2, V3			// d7612522
+	VAADDUVX	X10, V2, V0, V3			// d7612520
+	VAADDVV		V1, V2, V3			// d7a12026
+	VAADDVV		V1, V2, V0, V3			// d7a12024
+	VAADDVX		X10, V2, V3			// d7612526
+	VAADDVX		X10, V2, V0, V3			// d7612524
+	VASUBUVV	V1, V2, V3			// d7a1202a
+	VASUBUVV	V1, V2, V0, V3			// d7a12028
+	VASUBUVX	X10, V2, V3			// d761252a
+	VASUBUVX	X10, V2, V0, V3			// d7612528
+	VASUBVV		V1, V2, V3			// d7a1202e
+	VASUBVV		V1, V2, V0, V3			// d7a1202c
+	VASUBVX		X10, V2, V3			// d761252e
+	VASUBVX		X10, V2, V0, V3			// d761252c
+
+	// 31.12.3: Vector Single-Width Fractional Multiply with Rounding and Saturation
+	VSMULVV		V1, V2, V3			// d781209e
+	VSMULVV		V1, V2, V0, V3			// d781209c
+	VSMULVX		X10, V2, V3			// d741259e
+	VSMULVX		X10, V2, V0, V3			// d741259c
+
+	// 31.12.4: Vector Single-Width Scaling Shift Instructions
+	VSSRLVV		V1, V2, V3			// d78120aa
+	VSSRLVV		V1, V2, V0, V3			// d78120a8
+	VSSRLVX		X10, V2, V3			// d74125aa
+	VSSRLVX		X10, V2, V0, V3			// d74125a8
+	VSSRLVI		$15, V2, V3			// d7b127aa
+	VSSRLVI		$15, V2, V0, V3			// d7b127a8
+	VSSRAVV		V1, V2, V3			// d78120ae
+	VSSRAVV		V1, V2, V0, V3			// d78120ac
+	VSSRAVX		X10, V2, V3			// d74125ae
+	VSSRAVX		X10, V2, V0, V3			// d74125ac
+	VSSRAVI		$16, V2, V3			// d73128ae
+	VSSRAVI		$16, V2, V0, V3			// d73128ac
+
+	// 31.12.5: Vector Narrowing Fixed-Point Clip Instructions
+	VNCLIPUWV	V1, V2, V3			// d78120ba
+	VNCLIPUWV	V1, V2, V0, V3			// d78120b8
+	VNCLIPUWX	X10, V2, V3			// d74125ba
+	VNCLIPUWX	X10, V2, V0, V3			// d74125b8
+	VNCLIPUWI	$16, V2, V3			// d73128ba
+	VNCLIPUWI	$16, V2, V0, V3			// d73128b8
+	VNCLIPWV	V1, V2, V3			// d78120be
+	VNCLIPWV	V1, V2, V0, V3			// d78120bc
+	VNCLIPWX	X10, V2, V3			// d74125be
+	VNCLIPWX	X10, V2, V0, V3			// d74125bc
+	VNCLIPWI	$16, V2, V3			// d73128be
+	VNCLIPWI	$16, V2, V0, V3			// d73128bc
+
 	//
 	// Privileged ISA
 	//
diff --git a/src/cmd/asm/internal/asm/testdata/riscv64error.s b/src/cmd/asm/internal/asm/testdata/riscv64error.s
index 025d63a15c..6a7c9b9444 100644
--- a/src/cmd/asm/internal/asm/testdata/riscv64error.s
+++ b/src/cmd/asm/internal/asm/testdata/riscv64error.s
@@ -221,5 +221,37 @@ TEXT errors(SB),$0
 	VMVVV	V1, V2, V3			// ERROR "too many operands for instruction"
 	VMVVX	X10, V2, V3			// ERROR "too many operands for instruction"
 	VMVVI	$15, V2, V3			// ERROR "too many operands for instruction"
+	VSADDUVV V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSADDUVX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VSADDUVI $15, V2, V4, V3		// ERROR "invalid vector mask register"
+	VSADDVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSADDVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSADDVI	$15, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSUBUVV V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSUBUVX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VSSUBVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSUBVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VAADDUVV V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VAADDUVX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VAADDVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VAADDVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VASUBUVV V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VASUBUVX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VASUBVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VASUBVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSMULVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSMULVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRLVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRLVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRLVI	$15, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRAVV	V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRAVX	X10, V2, V4, V3			// ERROR "invalid vector mask register"
+	VSSRAVI	$15, V2, V4, V3			// ERROR "invalid vector mask register"
+	VNCLIPUWV V1, V2, V4, V3		// ERROR "invalid vector mask register"
+	VNCLIPUWX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VNCLIPUWI $16, V2, V4, V3		// ERROR "invalid vector mask register"
+	VNCLIPWV V1, V2, V4, V3			// ERROR "invalid vector mask register"
+	VNCLIPWX X10, V2, V4, V3		// ERROR "invalid vector mask register"
+	VNCLIPWI $16, V2, V4, V3		// ERROR "invalid vector mask register"
 
 	RET
diff --git a/src/cmd/asm/internal/asm/testdata/riscv64validation.s b/src/cmd/asm/internal/asm/testdata/riscv64validation.s
index 602cab2c2e..c6f71e64fb 100644
--- a/src/cmd/asm/internal/asm/testdata/riscv64validation.s
+++ b/src/cmd/asm/internal/asm/testdata/riscv64validation.s
@@ -237,5 +237,37 @@ TEXT validation(SB),$0
 	VMVVX	V1, V2				// ERROR "expected integer register in rs1 position"
 	VMVVI	$16, V2				// ERROR "signed immediate 16 must be in range [-16, 15]"
 	VMVVI	$-17, V2			// ERROR "signed immediate -17 must be in range [-16, 15]"
+	VSADDUVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VSADDUVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VSADDUVI $16, V2, V3			// ERROR "signed immediate 16 must be in range [-16, 15]"
+	VSADDUVI $-17, V2, V3			// ERROR "signed immediate -17 must be in range [-16, 15]"
+	VSSUBUVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VSSUBUVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VAADDUVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VAADDUVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VAADDVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VAADDVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VASUBUVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VASUBUVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VASUBVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VASUBVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VSMULVV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VSMULVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VSSRLVV	X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VSSRLVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VSSRLVI $32, V2, V3			// ERROR "signed immediate 32 must be in range [0, 31]"
+	VSSRLVI $-1, V2, V3			// ERROR "signed immediate -1 must be in range [0, 31]"
+	VSSRAVV	X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VSSRAVX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VSSRAVI $32, V2, V3			// ERROR "signed immediate 32 must be in range [0, 31]"
+	VSSRAVI $-1, V2, V3			// ERROR "signed immediate -1 must be in range [0, 31]"
+	VNCLIPUWV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VNCLIPUWX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VNCLIPUWI $32, V2, V3			// ERROR "signed immediate 32 must be in range [0, 31]"
+	VNCLIPUWI $-1, V2, V3			// ERROR "signed immediate -1 must be in range [0, 31]"
+	VNCLIPWV X10, V2, V3			// ERROR "expected vector register in vs1 position"
+	VNCLIPWX V1, V2, V3			// ERROR "expected integer register in rs1 position"
+	VNCLIPWI $32, V2, V3			// ERROR "signed immediate 32 must be in range [0, 31]"
+	VNCLIPWI $-1, V2, V3			// ERROR "signed immediate -1 must be in range [0, 31]"
 
 	RET
author	Joel Sing <joel@sing.id.au>	2025-01-06 00:30:30 +1100
committer	Joel Sing <joel@sing.id.au>	2025-04-01 05:31:22 -0700
commit	4c1b8ca98c716f0499bb30fd141aa6d4dec7390c (patch)
tree	a60b4973fb6987a81ee9eb6318edfea079fdfb06 /src/cmd/asm
parent	4c32b1cc753e9005ed7c741bf69d3cb69ee3a56c (diff)
download	go-4c1b8ca98c716f0499bb30fd141aa6d4dec7390c.tar.xz